[영화가 현실이 되다] '스페이스 오딧세이' 음성인식

입력 2010-10-28 11:29
  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

네비게이션·스마트폰 넘어 가전기기도 제어

본격적인 스마트 시대가 도래 하면서 사회는 점차 간결하고 단순한 것을 요구하며 기술의 진화를 부추기고 있다.

이런 변화의 분위기에 편승해 이제는 모든 언어를 감지해 문자를 보내고, 검색하는 등 이른바 ‘음성인식 기술’이 새로운 트렌드로 부상 중이다.

음성인식 기술은 전화나 휴대폰, 마이크 등을 통해 입력된 사람의 음성을 컴퓨터가 분석하고 특징을 추출해서 미리 입력된 단어나 문장에서의 근접한 결과를 출력하는 최첨단 소프웨어다.

네비게이션, 스마트폰, 어학기, 리모컨, 보안시스템, 자동차, 의료기구, 가정용전자기기, 음성인식 전화 등으로 일상에서 보편화 되는 추세다.

영화에서는 이미 42년전인 1968년 스탠리 큐브릭 감독이 만든 ‘2001 스페이스 오딧세이’에서 할9000(HAL9000)이라는 슈퍼컴퓨터가 사람과 대화가 가능할 정도로 뛰어난 인공지능을 선보였다.

할9000은 자동차 안에서 움직이는 사람의 입술을 인식해 언어를 이해하는데, 여기에서 쓰인 것이 바로 음석인식 기술이다.

또 지난해 말 개봉한 재난 영화 ‘2012’에서는 주인공들이 추락하는 비행기에서 탈출하기 위해 최신형 벤틀리의 시동을 ‘엔진’이라는 명령어 하나로 해결하는 장면이 인상적이다.

영화에서는 42년이 지난 현재 음성인식 기술이 상용화 될 것을 예견했을까. 영화가 현실이 될 수 있다는 가정은 쉽지 않지만 음성인식 기술이 현 시대에서 분명한 패러다임이라는데는 이견이 없다.

실제로 국내에서도 음성인식 기술은 최근의 것이 아니다. 지난 1997년 LG정보통신(현 LG전자 MC 사업부)에서 출시한 휴대폰 ‘프리웨이’가 이 기술을 탑재했다.

자동차 안에서 ‘우리집~~’이라고 말을 하자 입력된 전화번호로 연결되는, 당시로서는 제품보다 CF가 인기를 끌었지만 획기적인 기술에 반해 인식률이 현저히 떨어졌고 음성으로 전화를 거는데 대한 거부감으로 인해 시장에서 크게 주목 받지는 못했다.

그러나 최근에는 위상이 달라졌다. 요즘 내로라하는 아파트에 입주하는 사람들은 휴대용 무선 홈패드를 무상으로 받는다. 초박막 액정화면으로 이뤄진 홈패드는 통합제어장치로 주방과 거실의 전등도 켜거나 끄고 전자레인지로 음식물을 조리하는 것도 가능하다.

휴대전화로는 무선인터넷에 들어가 가정의 가전기기를 원격제어 하는 서비스도 이뤄지고 있다. 조만간 음성으로 명령해 가전기기를 제어하는 기술도 대중화될 예정이다.

항공사 예약 시스템과 홈쇼핑 상품 주문에 음성인식 인터페이스를 도입이 한창이고 증권사는 음성인식을 이용한 매매 서비스를 선보였다.

미 공군은 최신예 F-35 전투기에 항공기 사상 처음으로 음성인식 기능을 내장했다고 밝힌 바 있다. 음성인식 시스템이 각종 자료에 접근하도록 전투기에 탑재된 컴퓨터와 통합시켰다.

모바일 분야도 음성인식의 중요한 응용 분야이다. 애플 아이폰은 음성인식 어플리케이션(드래곤 서치, 드래곤 아이)을 설치하고 목소리로 말하면(영어만 인식) 음성으로 텍스트를 변환시켜준다.

구글 넥서스원은 기본적으로 음성인식 기능을 탑재해서 나오고, KTH에서는 쇼옴니아용으로 음성을 통한 맛 집을 검색하는 서비스를 공개해 화제가 되기도 했다.

또 운전을 하면서 말만 하면 오디오와 에어컨이 켜지고 창문이 열리며 조작 없이 음성으로 목적지를 바로 검색하는 시스템도 눈에 띈다. 현대자동차 ‘제네시스’와 쌍용자동차 ‘체어맨W’도 이같은 음성인식 시스템을 탑재하고 있다.

지난 6일에는 구글이 음성으로 문자 입력을 할 수 있는 모바일 서비스를 국내에 선보였다. 클라우드 컴퓨팅 파워를 통해 휴대폰 프로세서만으로는 불가능한 빠른 속도와 높은 정확성을 구현했다.

내비게이션 업계에서는 지난 5월 파인디지털이 국내 최대인 100만 단어의 음성인식 기능을 탑재한 ‘파인드라이브 iQ 3Dv’로 주목받고 있다.

단어 단위로 인식하는 과거 방식 대신, 음성을 일일이 자음, 모음 등 음소 단위로 풀어서 문자로 바꾸는 구조를 채택했다.

한국전자통신연구원(ETRI) 원천기술을 이용한 순수 국내 기술력이라는 점과 명령어 97%, 목적지 검색 90~93%의 뛰어난 음성인식 성공률을 자랑하고 있다.

한국전자통신연구원 음성·언어정보연구부 박상규 부장은 “음성인식은 교육, 교통, 모바일 등 여러 분야에서 응용할 수 있는 획기적인 기술”이라며 “틈새시장을 열어 줄 것으로 기대되는 차세대 음성인식 기술에 대해 국가적인 차원에서 관심과 지원이 더해진다면 관련 중소기업이 연계된 새로운 형태의 산업생태계를 창출할 수 있을 것”이라고 말했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • "생활고 때문에" 전국진, '쯔양 협박' 300만원 갈취 인정…유튜브 수익 중지
  • '트로트 4대 천왕' 가수 현철 별세…향년 82세
  • '따다닥'→주먹 불끈…트럼프 피 흘리는 '사진 한 장'의 나비효과 [이슈크래커]
  • 결혼식 굳이? 미혼남녀 38% "생략 가능" [데이터클립]
  • 2위만 만나면 강해지는 호랑이, 빛고을서 사자 군단과 대격돌 [주간 KBO 전망대]
  • FBI “트럼프 총격범, 단독범행…정신병력 없다”
  • 변우석, 오늘(16일) 귀국…'과잉 경호' 논란 후 현장 모습은?
  • 문교원 씨의 동점 스리런…'최강야구' 단언컨데 시즌 최고의 경기 시작
  • 오늘의 상승종목

  • 07.15 장종료

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 91,136,000
    • +6.79%
    • 이더리움
    • 4,906,000
    • +7.68%
    • 비트코인 캐시
    • 562,500
    • +6.23%
    • 리플
    • 755
    • +3%
    • 솔라나
    • 224,700
    • +8.6%
    • 에이다
    • 626
    • +3.3%
    • 이오스
    • 832
    • +2.97%
    • 트론
    • 193
    • -0.52%
    • 스텔라루멘
    • 148
    • +0.68%
    • 비트코인에스브이
    • 62,800
    • +7.35%
    • 체인링크
    • 20,230
    • +7.15%
    • 샌드박스
    • 478
    • +5.29%
* 24시간 변동률 기준