• 전체기사
    • 서울
      B
      16℃
      미세먼지 매우나쁨
    • 경기
      Y
      16℃
      미세먼지 매우나쁨
    • 인천
      H
      15℃
      미세먼지 매우나쁨
    • 광주
      Y
      16℃
      미세먼지 매우나쁨
    • 대전
      Y
      19℃
      미세먼지 매우나쁨
    • 대구
      H
      25℃
      미세먼지 나쁨
    • 울산
      Y
      23℃
      미세먼지 나쁨
    • 부산
      Y
      21℃
      미세먼지 나쁨
    • 강원
      B
      19℃
      미세먼지 매우나쁨
    • 충북
      B
      19℃
      미세먼지 매우나쁨
    • 충남
      Y
      19℃
      미세먼지 매우나쁨
    • 전북
      Y
      18℃
      미세먼지 매우나쁨
    • 전남
      Y
      17℃
      미세먼지 나쁨
    • 경북
      H
      25℃
      미세먼지 나쁨
    • 경남
      Y
      22℃
      미세먼지 나쁨
    • 제주
      H
      19℃
      미세먼지 나쁨
    • 세종
      B
      20℃
      미세먼지 매우나쁨
2021-05-07 15:56 (금)
[정종기의 AI시대 저널리즘] 인공지능의 ‘자연어 처리’ 시장 무한한 가능성 가진 ‘블루오션’
[정종기의 AI시대 저널리즘] 인공지능의 ‘자연어 처리’ 시장 무한한 가능성 가진 ‘블루오션’
  • 정종기 칼럼니스트 jinsyero@
  • 승인 2020.12.16 15:51
  • 댓글 0
이 기사를 공유합니다

정종기 박사
정종기 박사

인공지능(AI)은 인간의 지능으로 할 수 있는 지각, 학습, 추론, 자연언어처리, 문장이해, 시각인식, 영상인식, 음성인식 등을 컴퓨터가 실행하는 영역으로 ‘컴퓨터 두뇌’라고도 한다. 인공지능은 최근 4차 산업혁명을 주도하고 있는 핵심 신기술이지만 대부분 외국에서 주도하고 있고 한국이 주도하는 선도적인 분야는 아직 미흡하기 때문에 정부와 대기업 그리고 인공지능 기술을 전문으로 연구 개발하는 중소기업을 중심으로 다양한 연구 개발이 한창 진행 중이다. 국내외적으로 인공지능 기술은 이제 연구 수준에서 벗어나 실제 활용할 수 있는 실행 단계에 접어들었고, 첨단 기술과 융합돼 빠르게 발전하고 있다. 

최근 인공지능 개발 트렌드는 단순히 인지능력 즉, ‘보다’, ‘듣다’, ‘읽다’ 정도의 인지능력에서 벗어나고 있다. 인지한 환경 속에서 목적 달성을 위해 최적의 답을 찾아내고, 반복 학습을 통해 지식을 고도화하고, 여기에 수행한 학습을 더해 추론 및 예측을 하며, 향후에는 문제를 스스로 발견하고 해결하는 자율적 판단과 행동 단계에 이르기까지 다양한 분야의 연구와 투자가 활발히 진행되고 있다. 

최근 네이버가 AI 기술이 적용된 음성기록 서비스 ‘클로바노트(CLOVA Note)’를 출시했다. 클로바노트는 텍스트로 변환된 녹음 내용을 참고해 필요한 내용만 다시 ‘눈으로 보며 듣기’가 가능한 새로운 음성기록 서비스다. 이 서비스는 인터뷰나 업무 미팅 등 음성을 기록하는 다양한 상황에서 대화 내용을 받아 적거나 녹음을 다시 들으며 필요한 내용을 찾는데 들이는 시간과 노력을 크게 줄일 수 있을 것 같다. 

클로바노트는 앱을 다운받아 직접 녹음하거나 앱 또는 PC에서 음성 파일을 업로드해 사용할 수 있다. 음성 파일을 업로드하면 해당 내용이 참석자의 목소리까지 구분된 텍스트로 변환돼 화면에 나타난다. 다시 음성으로 확인하고 싶은 부분의 텍스트를 클릭하면 해당 내용을 바로 들을 수 있다. 앱과 PC는 자동으로 동기화돼, 앱에서 녹음을 마치면 PC에서 바로 텍스트로 변환된 음성기록을 확인할 수 있기 때문에 기업에서의 업무 처리 및 비즈니스에 많은 도움이 될 것으로 보인다. 

일반적으로 많은 기업들이 거의 매일 회의와 미팅을 진행하는데 그때마다 누군가는 노트에 기록을 하고, 기록 정리된 미팅 내용을 참석자 및 이해 관계자에게 공유를 하는 것이 일반적이다. 기업은 이러한 솔루션을 이용해 시간과 인력, 비용을 절약해 기업업무를 효율적으로 운용할 수 있다. 그리고 많은 학생들이 강의를 들을 때 본인의 스마트폰이나 다른 녹음 기기를 이용해 강의 내용을 녹음하고 반복 학습하며 중요한 내용을 필기해 이해하고 암기하는 경우가 많다. 이런 이들에게도 도움이 될 것 같다. 

인공지능은 어떻게 사람의 말을 알아 듣고, 언어를 이해하고 답할 수 있을까?

음성인식(Voice recognition)기술은 컴퓨터가 마이크와 같은 소리 센서를 통해 얻은 음향학적 신호(Acoustic speech signal)를 단어나 문장으로 변환시키는 기술을 말한다. 음성인식기술은 일반적으로, 음향 신호를 추출한 후 잡음을 제거하는 작업을 하게 된다. 이후 음성 신호의 특징을 추출해 소리의 파동을 디지털 신호로 기록해 놓은 음성모델 데이터베이스(DB)와 비교하는 방식으로 음성인식을 하게 된다. 바로 여기서부터 인공지능, 딥러닝 기술이 사용된다. 

인공지능 기술의 특징은 데이터에서 특정한 패턴을 찾아내는 것이다. 즉, 오디오 파일에서 각각의 소리의 파행에 대해 학습을 마치고 나면 이어진 음성의 파행을 분석해 소리를 분석해 내고 문법과 문맥에 적합한 문장을 완성시키는 방식이다. 어떤 문장이 더 적합한지를 판단하기 위해서는 수많은 문장에 대한 학습이 필요하다. 

사람과 인공지능은 서로 다른 언어를 쓴다. 사람도 한국어, 영어, 일본어, 중국어를 쓰듯이 인공지능도 인공지능만의 언어가 있다. 그래서 사람과 인공지능이 대화하려면 이를 통역할 수 있어야 하는데, 사람이 쓰는 언어는 ‘자연어’라고 부르고, 인공지능이 쓰는 언어는 ‘인공어’라고 부른다. 자연어와 인공어의 가장 큰 차이는 정돈된 완벽한 문법이 있는지 여부이다. 

사람이 살면서 자연스럽게 형성된 언어는 큰 규칙은 있지만, 완벽한 규칙은 없다. 그리고 언어를 글씨로 표현하는 것과 말로 표현하는 데서 담긴 뜻이 달라질 수도 있다. 하지만 인공지능기술로 개발된 컴퓨터의 인공어는 그렇지 않다. 정확한 규칙을 지키지 않으면 인공지능이 이해 자체를 할 수 없다. 이처럼 사람의 언어인 자연어를 인공지능이 이해할 수 있도록 하는 번역을 ‘자연어 처리(Natural Language Processing: NLP)’, 그리고 처리를 거쳐 인공지능이 자연어에 담긴 뜻을 파악하는 과정을 ‘자연어 이해(Natural Language Understanding: NLU)’라고 한다. 

예를 들어, 사람이 애기하는 일반적인 자연어 중 주어-목적어-서술어가 무엇인지 파악하고, 주제는 무엇인지, 꼭 알아야 하는 핵심 단어는 무엇인지 분석해 인공지능이 알아들을 수 있는 형태로 번역하는 과정이 자연어 처리이다. 그리고 그 뜻과 내용을 알맞게 이해하는 과정이 자연어의 이해이다. 

자연어 처리란 커뮤니케이션과 관련된 인공지능의 한 분야이다. 

머신러닝을 통해 문구와 문장을 수집해 단어의 패턴과 개념을 습득한 후 관련 정보를 바탕으로 발화자의 실생활 속 언어 사용 습관인 속어, 발음, 맞춤법 실수 등을 컴퓨터가 이해하고, 처리해 구사하는 기술이다. 각 개인의 특성 및 성향에 따라 언어적 스타일이 상이하기 때문에 자연어 처리는 막대한 양의 데이터와 소프트웨어 기술이 요구된다.

자연어 처리 기술은 정서 분석, 맞춤법 검사, 인공지능 음성인식 스피커 등에 주로 사용되고 있다. 특히 인공지능 기반의 음성인식 스피커는 자연어를 기반으로 하고, 사용자의 음성과 명령어를 이해한 후 실시간으로 답변하고 수행한다. 아직은 대부분의 솔루션이 음성인식 오류로 완벽하게 수행하지 못하기 때문에 정확도를 높이기 위한 기업들의 기술 개발과 기업간의 협력 사례가 증가하고 있다. 인공지능이 자연어를 이해하려면 자연어에 담긴 특성, 한국어나 중국어, 일본어나 영어마다 담긴 모든 특성을 파악해야 하고, 특성에 맞게 해석할 수 있는 알고리즘이 필요하다.

자연어 처리기술을 보유한 대표적인 기업은 Apple, Google, Amazon, SamSung, IBM, Microsoft 등이다. Apple의 대표 음성인식 시스템인 시리(Siri)는 사용자가 음성명령을 할 때마다 반복적으로 사용하는 단어와 말투를 학습해 사용자가 이메일, 메시지 확인과 같은 음성 명령을 내릴 시 기존에 구축해 놓은 음성정보와 대조해서 모바일 검색, 일정 관리, 전화걸기, 음악재생 등 다양한 정보서비스를 빠르게 응대해 준다.

아마존(Amazon)의 자연어 처리 시스템(Amazon Comprehend)은 고객인 기업에 보낸 이메일, 제품 후기, 소셜 네트워크 서비스에 게재된 기업 평가 등을 해석하고, 언어 뒤에 숨겨진 고객의 심리 상태를 통찰해 기업이 제공하는 서비스 및 제품에 대한 고객만족도를 식별해 고객관계관리를 더 잘할 수 있도록 분석 정보제공까지 가능하다.

IBM의 자연어 처리 소프트웨어(Cognos Analytics)는 자연어 및 문서가 내포하고 있는 전반적인 정서 및 감정 또는 텍스트에 포함된 키워드와 관련해 의도된 정서 및 감정을 파악해 심층 분석이 가능하다. 

최근 시장분석기관 statista.com에 따르면 자연어 처리시장은 2017년 약 32억 달러에서 2025년 약 432억 달러로 확대될 전망이다. 자연어 처리 기술은 다양한 사회분야에서 사용될 전망이다. 특히 가장 많이 사용하는 산업으로 인공지능 스피커시장이고, 시장규모는 2024년까지 약 7000억 달러 시장으로 성장할 것으로 전망하고 있다. 최근 다국어 지원을 필요로 하는 소비자가 증가하면서 스피커 시장과 음성인식 기술을 포함한 자연어 처리 시장이 동반 상승할 것으로 보인다.

<정종기박사, AI 비즈니스 전문가 1호 / 얼라이언스코리아 대표 / 한국외국어대학교 겸임교수>

오늘경제


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.