Medium - What Is Deep Learning?
in Trend
Trend 파악을 Medium 기고문 요약 포스팅 - 딥러닝에 대하여
딥러닝은 머신러닝의 한 종류로서 경험을 통해 컴퓨터의 작업 수행을 설정하는 인공지능입니다. 여기서 더욱 자세히 알아봅시다.
Ben Dickson
딥러닝은 발전된 인공지능 기술로서, 풍부한 기술과 연산능력의 향상으로 최근에 매우 유명해졌습니다. 소셜 미디어의 자동 얼굴 태그나 온라인 언어 번역을 포함하여 우리가 일상에서 쓰는 많은 응용프로그램에 딥러닝이 사용됩니다.
이 기술은 건강관리에도 도움이 되고 있습니다. 올해 초 MIT의 컴퓨터 과학자들은 딥러닝을 사용하여 유방암을 탐지하는 새로운 프로그램을 개발했습니다.
고전적인 모델은 엔지니어가 수동적으로 규정과 암을 진단하기 위한 로직을 정해야 했지만 이 새로운 모델은 6만명의 환자로 부터 9만개의 고해상도 X선 사진을 스캔하여 누가 유방암을 가지고 있는지 공통적인 패턴을 찾도록 했습니다. 또한 5년 내에 유방암 발병환자를 예측할 수도있고 예전 위험 예측모델에 비해 혁신적인 발전을 했습니다.
What Exactly Is Machine Learning?
딥러닝은 머신러닝의 종류로써 경험을 통해 컴퓨터가 수행하는 작업을 설정하는 인공지능 입니다. 규칙에 기반한 고전적인 AI시스템과 반대로 머신러닝 알고리즘은 이른바 “학습”이라고 불리는 프로세스를 통해 주석이 달린 예제를 이용하여 그들의 행동을 개선합니다.
예를 들어 가짜 탐지 프로그램을 만든다면 은행의 거래와 그것의 최종 결과(진실,거짓) 리스트를 이용하여 머신러닝을 학습시킵니다. 머신러닝 모델은 예제를 검토하고 정상적인 거래와 부정거래의 일반적인 특성을 통계적으로 표현하는 것을 발전 시킬 것입니다. 그리고 알고리즘에게 새로운 은행 거래를 전달하면 그것은 예제를 통해 학습한 패턴을 바탕으로 정상인지 부정거래인지 규정할 것입니다.
규칙의 가장 중요한 점으로 데이터의 질이 좋을 수록 머신러닝 알고리즘의 결과가 더욱 정확할 것입니다.
머신러닝은 규칙을 정확히 정할 수 없고 식별가능한 명령어로 작성할 수 없는 문제를 해결하는데 유용합니다. 다른 유형의 알고리즘은 다른 작업에 더욱 뛰어나죠.
Deep Learning and Neural Networks
고전적인 머신러닝 알고리즘이 룰 기반 프로그램이 고군분투하던 많은 문제를 해결했지만 이미지와 비디오, 사운드 파일 그리고 구조화되지 않은 데이터를 가지고 해결하는 것에는 부족했습니다.
예를 들어 고전적인 머신러닝 기법으로 유방암 진단 모델을 만든다면 수십명의 전만가와 컴퓨터 프로그래머, 수학자의 노력이 필요합니다. 그 연구는 구현해야할 기능이 매우 많을 것이고 컴퓨터가 엑스레이와 MRI 스캔에서 알려진 패턴을 발견하도록 하는 프로세스는 몹시 힘이 들 것입니다. 그리고 나서야 엔지니어는 만들어진 추출된 특징에 머신러닝을 사용하겠죠. 이런 AI 모델을 만드는 것은 몇 년은 걸릴 것입니다.
립러닝 알고리즘은 인간의 두뇌에서 감명을 받은 신경 네트워크를 사용하여 동일한 문제를 해결할 수 있습니다(비록 신경 네트워크와 생물학적 신경계는 차이가 있지만요). 신경 네트워크는 변수 계층의 상위 계층으로 그들이 학습한 데이터의 특성들을 적용하여 이미지 구분과 STT 변환 같은 작업을 수행합니다.
Artificial neural network (source: Wikipedia)
신경 네트워크는 비구조화된 데이터에서 자우룝게 일반적인 패턴을 찾아내는데 매우 좋습니다. 예를 들어 당신이 신경 네트워크를 다른 물체로 학습시켜도 해당 이미지에서 특징들을 추출할 것입니다. 신경 네트워크의 각 계층은 선과 면과 모서리와 같은 구체적인 특징을 탐지할 것입니다.
Top layers of neural networks detect general features. Deeper layers detect actual objects (source: arxiv.org)
신경 네트워크를 사용함으로써 딥러닝 알고리즘은 특징을 처리하지 않아도 됩니다. MIT의 유방암 예측 모델처럼 딥러닝 덕분에 해당 프로젝트는 컴퓨터 과학자와 도메인 전문가의 수고를 덜고 훨씬 적은 시간이 들었죠. 또한 해당 모델은 사람이 놓친 패턴과 특징들도 찾아낼 수 있었습니다.
신경 네트워크는 1950년대(개념적으로)부터 존재했지만 최근까지 AI 단체에서는 해당 개념을 기각했습니다. 어마어마한 데이터와 연산능력이 필요했기 때문이죠. 몇 년전 데이터와 저장공간, 컴퓨터 자원이 딥러닝에서 사용할 수 있는 수준이 되었기 때문에 신경 네트워크가 AI 혁신을 일으킬 수 있었습니다.
What is Deep Learning Used For?
딥러닝이 이전에 컴퓨터가 풀지못했던 문제를 해결하는데 도움이 되는 몇몇 분야가 있습니다.
컴퓨터 비전: 컴퓨터 비전은 이미지와 비디오의 내용을 이해는 소프트웨어를 사용하는 과학입니다. 이것은 딥러닝으로 인해 매우 큰 진척을 이뤄낸 분야입니다. 유방음을 제외하고 립러닝 이미지 처리 알고리즘은 다른 종류의 암이나 질병을 진단하는데 도움을 주고 있습니다.
딥러닝은 또한 여러분의 일상에 깊숙히 자리 잡고 있습니다. 애플의 페이스 ID도 딥러닝을 사용하고 구글 포토 또한 딥러닝을 사용하여 사물을 찾거나 장면을 찾는데 사용하고 잇습니다. 페이스북은 딥러닝을 사용하여 여러분이 올린 사진의 사람을 자동적으로 태그하고 있습니다.
소셜 미디어 기업들은 딥러닝을 사용하여 자동적으로 폭력물이나 성인물과 같은 수상한 컨텐츠를 차단하거나 식별하는데 사용하고 있습니다. 그리고 마침내 딥러닝은 자율주행 자동차가 주변을 이해하는데 매우 중요한 역할을 하고 있습니다.
음성 인식: 여러분이 아마존 에코 스마트 스피커나 구글 어시스턴트에게 입으로 명령을 내리면 딥러닝 알고리즘이 여러분의 목소리를 텍스트 명령으로 변환합니다. 여러 온라인 응용프로그램은 음악과 영상 파일을 번역하는데 딥러닝을 쓰고 있습니다. 구글이 최근에 출시한 실시간으로 기기에서 필기해주는 스마트폰 앱은 딥러닝을 통해 당신이 말하는 것을 타이핑 합니다.
자연어 처리와 자연어 생성: 자연어 처리는 비구조화된 텍스트에서 의미를 추출하는 과학으로서 고전적인 소프트웨어에게 역사적으로 고통을 주어왔습니다. 모든 명사를 정의하고 쓰여진 언어들의 숨은 의미를 파악하는 규칙을 작성하는 것은 사실상 불가능 했습니다. 그러나 많은 분량의 텍스트를 학습한 신경 네트워크는 정확하게 많은 자연어 처리 작업을 수행할 수 있습니다.
구글의 번역 서비스는 딥러닝으로 교체하면서 엄청나게 성능이 향상되었습니다. 스마트 스피커는 자연어 처리 딥러닝을 사용하여 날씨나 방향을 묻는 다양한 방식의 명사 명령어를 이해합니다.
딥러닝은 자연어 생성이라고 불리는 의미있는 텍스트를 생성하는 것에도 매우 효과적입니다. 구글 스마트 답장과 스마트 작문은 딥러닝을 사용하여 당신의 이메일에 적합한 반응을 하도록하고 당신의 문장을 완성하기 위한 제안을 합니다. 올해 초, OpenAI에 의해 개발된 텍스트 생성 모델은 텍스트와 연관된 긴 인용구문을 생성했습니다.
The Limits of Deep Learning
이런 많은 장점에도 불구하고 딥러닝 또한 단점이 있습니다.
Data dependency: 일반적으로 딥러닝 알고리즘은 정확하게 작업을 수행하기 위해 엄청난 양의 학습 데이터가 필요합니다. 그러나 많은 문제에 있어서 딥러닝 모델을 만들기 위한 양질의 학습 데이터가 충분하지 않습니다.
Explainability: 신경 네트워크는 매우 복잡하게 그들의 행동을 발전시켜서 만든 사람도 행동을 이해하기가 어렵게 만듭니다. 분석하기가 어렵기 때문에 트러블 슈팅과 딥러닝 알고리즘을 고치는 것이 매우 힘듭니다.
Algorithmic bias: 딥러닝 알고리즘은 그들이 학습한 데이터에 대해서만 정확합니다. 문제는 학습한 데이터가 숨겨지거나 명백한 경향이 있는 경우 그 알고리즘은 그 경향을 그대로 답습합니다. 예를들어 주로 백인의 얼굴 사진으로만 학습한 알고리즘은 유색인종의 사진은 정확도가 떨어질 것입니다.
Lack of generalization: 딥러닝 알고리즘은 작업을 수행하는데는 좋지만 그들의 지식을 다음 세대로 넘겨주는 것은 부족합니다. 사람과 달리 스타크래프트를 학습한 딥러닝 모델은 비슷한 게임은 워크래프트를 할 수 없습니다. 또한 딥러닝은 학습 예제에서 빗나간 이른바 “엣지 케이스”에 해당하는 데이터를 처리하는 것도 미숙합니다. 이것은 자율주행 차량과 같은 경우 심각한 위험이 될 것입니다.
The Future of Deep Learning
올해 초, 딥러닝의 창시자들은 컴퓨터 계의 노벨상인 튜링 상을 받았습니다. 그러나 딥러닝과 신경 네트워크를 이용한 작업은 아직 한참이나 멀었죠. 다양한 분야에서 딥러닝을 개선시키기 위해 많은 노력을 하고 있습니다.
딥러닝을 포함하여 흥미로운 작업물들은 설명가능하거나 이해를 할 수 있어서 그들의 행동을 적은 학습 데이터로 발전 시킬 수 있습니다. edge AI 모델은 딥러닝 알고리즘이 방대한 클라우드 연산 자원에 기대지 않고 작업을 수행할 수 있습니다.
그리고 딥러닝이 현재 가장 발전된 인공지능 기술이지만 AI 산업의 최종 목적지는 아닙니다. 딥러닝과 신경 네트워크의 발전은 우리에게 완전히 새로운 아키텍쳐를 가져다 줄 것입니다.
Summary
- 머신러닝과 딥러닝에 대한 개념
- 딥러닝의 장점과 단점, 현재의 활용처와 미래의 발전방향