2012년부터 2020년까지는 딥러닝 기술이 눈에 띄게 확산되고, 실제로 다양한 분야에 활용되며 인공지능(AI)의 대중화가 가속화된 시기입니다.
1. 컴퓨터 비전: 인공지능이 이미지를 보고 이해하기 시작하다
2012년, 'AlexNet'이라는 딥러닝 모델이 이미지 인식 대회에서 다른 모델들을 압도적으로 이기면서 세상을 놀라게 했습니다. 이 모델은 사진 속에 어떤 물체가 있는지를 정확하게 분류하는 데 탁월했는데요, 여기서 사용된 기술이 바로 **합성곱 신경망(CNN)**입니다.
그 이후로 CNN은 컴퓨터 비전의 표준 기술이 되었고, 다음과 같은 분야에 널리 쓰이기 시작했습니다:
- 스마트폰의 얼굴 인식
- 자율주행차의 도로 표지판 인식
- 의료 영상 분석(CT, MRI 등에서 종양 찾기)
- 공장 자동화 시스템에서 불량품 검출
즉, 인공지능이 이미지를 '보고' 판단할 수 있는 시대가 열린 것입니다.
2. 자연어 처리(NLP): 컴퓨터가 사람 말을 이해하기 시작하다
초기에는 컴퓨터가 단어 하나하나를 따로 처리해서 문장 전체 의미를 잘 이해하지 못했지만, **RNN(순환 신경망)**과 **LSTM(장단기 기억 네트워크)**가 도입되면서 문맥까지 고려한 언어 이해가 가능해졌습니다.
예를 들어, "나는 어제 비행기를 탔다"라는 문장에서 '탔다'가 어떤 의미인지 앞 문맥을 보고 이해할 수 있게 된 것입니다. 이런 기술은 다음에 쓰였습니다:
- 스마트폰 음성 비서 (Siri, Google Assistant)
- 기계 번역 (구글 번역)
- 고객 센터 챗봇
- 뉴스 기사 요약
2017년에는 트랜스포머(Transformer) 구조가 등장하면서, 속도와 정확도 모두 크게 향상되었습니다. 이후 등장한 BERT와 GPT 모델은 자연어를 이해하고 생성하는 데 있어 큰 변화를 이끌었습니다.
3. 이미지 생성: 인공지능이 그림을 그리기 시작하다
2014년, 이안 굿펠로우(Ian Goodfellow)가 제안한 **생성적 적대 신경망(GAN)**은 인공지능이 가짜 이미지를 진짜처럼 만들어내는 기술입니다.
GAN은 두 개의 신경망이 경쟁하듯 학습하는 구조인데요:
- 생성자: 가짜 이미지를 만듭니다.
- 판별자: 진짜인지 가짜인지 구분합니다.
이 과정을 반복하면서 점점 더 진짜 같은 이미지가 만들어지죠. 이 기술은 다음과 같이 활용됩니다:
- 가짜 인물 사진 생성 (예: ThisPersonDoesNotExist.com)
- 게임/영화 배경 디자인
- 패션 디자인 시뮬레이션
- 예술 창작 도구 (AI 화가)
4. 강화학습 + 딥러닝: 게임을 넘어서 현실 문제까지 해결
강화학습은 AI가 스스로 시행착오를 통해 정답을 찾는 학습 방식입니다. 여기에 딥러닝을 결합한 것이 **딥 강화학습(Deep Reinforcement Learning)**입니다.
대표 사례는 2016년의 **알파고(AlphaGo)**입니다. 인간 최고 바둑 고수를 이긴 AI로, 구글 딥마인드가 개발했습니다.
그 이후 이 기술은 다양한 현실 문제에 응용되고 있습니다:
- 물류 최적화 (창고에서 물건을 효율적으로 배치)
- 자율주행 차량 제어
- 로봇팔 조작
- 스마트 공장의 생산 계획 수립
이처럼 강화학습은 '스스로 학습해서 문제를 해결하는 AI'로 진화 중입니다.
'인공지능의 발전 > 머신러닝의 부상' 카테고리의 다른 글
벨만 방정식(Bellman Equation) (1) | 2025.04.28 |
---|---|
2.3-b 강화학습의 발전 (2) | 2025.04.28 |
AlexNet의 이미지넷 대회 우승 (3) | 2025.04.20 |
Deep Belief Networks(DBN)란? (0) | 2025.04.20 |
2.3-a 딥러닝 혁명의 역사와 주요 발전 단계 (2) | 2025.04.20 |