매셔블 (mashable.com) 의 Lance Ulanoff의 글을 번역한 기사입니다.

야후의  축구 리포트나, NFL, MLB, NBA 경기 관전평, 기상예보, 주식보험 관련 리포트, 에드먼드닷컴의 자동차 설명은 모두 한 사람의 기자가 쓴 기사다. 그 기자의 이름은 워드스미스. 워드스미스가 누구냐고?
워드스미스(Wordsmith)는 수 많은 양의 기사를 대량으로 찍어내기 위한 인공지능 시스템이다. 이 시스템은 전 시스코 직원이자 현재 오토메이티드 인사이트(Automated Insights)의 CEO인 로비 앨런(Robbie Allen)에 의해 구상된 클라우드 기반의 플랫폼이다. 쉽게 말해서 로봇 기자다. 이 로봇 기자는 사실 꽤 평판이 좋다. 실제 많은 미국인들이 워드스미스의 기사를 현재도 읽고 있으며, ‘기레기’라고 욕도 하지 않는다.

robot_journalist_jpg_CROP_promo-mediumlarge

AP의 기사에 로봇 기자가 등장한다.

앨런은 최근 세계 최대 통신사인 AP의 수익 보고서 관련 기사 제공에 워드스미스를 활용하기로 계약했다. 워드스미스가 기자들에 비해 15배가 넘는 기사를 생산할 수 있기 때문이다. 그리고, AP의 첫 기사는 아마 이번 달에 나올 것이다. 세계 최대의 통신사에 로봇 기자가 등장한 역사적 사건이다. 그러나 미국에서는 이런 일이 더 이상 낯선 일이 아니다. 비슷한 경쟁기업인 내러티브 사이언스(Narrative Science) 역시 포브스(Forbes)를 통해 비슷한 기사를 양산하고 있기 때문이다.

궁금한 것은 이런 로봇의 기사가 숙련된 기자들의 기사와 어떤 차이가 있느냐일 것이다. 로비 앨런은 “설득력 있는 기사를 작성하려면 기업 보도 자료와 매출 보고서 외에도 연간 데이터가 필요하다.”라고 말하면서 새로운 데이터를 계속해서 업데이트하는 것과 데이터 변동성에 대한 노하우가 중요함을 말했다. 워드스미스는 아마존의 클라우드 기반 서비스인 AWS를 통해 1~2시간 동안 수 천개의 서버에 있는 데이터를 모아 수 백만가지의 기사를 만들어 낼 수 있다.

물론 워드스미스가 항상 설득력 있는 기사를 쓰는 것은 아니다. 앨런은 계속해서 워드스미스가 문장과 단락 구조들을 개선하기 위해 노력하고 있으며, 글 안에 뉘앙스나 특유의 분위기를 살리는 법도 학습하고 있다고 말한다.  워드스미스의 궁극적인 목표는 로봇이 쓴 글처럼 느껴지지 않게 하는 것이다. 다만 아직까지 미묘한 문제는 있다. 대표적인 것은 바이라인(기사를 쓴 기자 이름을 적는 것)이다. AP나 포브스 같은 유력지들은 자신들의 기사가 로봇에 의해 써졌다는 것을 독자들에게 알리고 싶지 않을 것이다. 좋은 기사도 로봇이 썼다고 하면 속은 기분이 들 수도 있을테니까.

 

일주일에 5백 만개의 겹치지 않는 기사

이제부터 놀랄 이야기를 해야 겠다. 2013년 한해동안 워드스미스는 300만개의 기사를 썼다. 모든 미디어 기업들이 일년간 쓴 글을 모두 합친 것보다 더 많은 기사다! 2014년에는 10억개의 기사를 쓸 것으로 내다보고 있다. 우리는 앨런에게 질문했다. “일주일에 5백 만개의 기사를 써야 한다는 건데, 어떻게 반복되지 않는 기사를 계속해서 쓸 수 있는 것인가?”
워드스미스는 이제 다양한 방법을 알고 있다. 이야기 구조를 바꾸고, 어법을 달리 하며, 역사적 일화도 인용이 가능해졌다.  한 대학교수는 워드스미스가 쓴 NFL(미국 풋볼) 관련 기사를 일반 기자와 쓴 글과 비교하는 실험을 했는데, 실험에 참가한 절반 이상의 사람이 구별을 하지 못했다. 특정 분야에 있어 로봇과 기자의 실력 차이가 사라졌다는 얘기다.

로봇 기자의 활약은 단순한 기사에 그치지 않는다. 우리가 업무를 하면서 만들어야 하는 수 많은 보고서, 잡무에 있어서도 워드스미스의 실력이 발휘될 수 있다. 워드스미스는 이미 각 지역의 도시들과 협약하여 학업 성취도 보고서, 범죄 리포트 등의 보고서를 자동화하여 경찰과 교사들의 업무를 줄여주는 방안을 논의중이다.

 

개인기자를 두는 세상이 온다.

그렇다면 이제 기자들은 로봇에게 일자리를 뺏겨 길거리에 나앉게 될 수순인가?
앨런은 그렇지 않다고 한다. 오히려 기자들이 하는 일을 도울 것이라고 말한다. 즉, 잡스러운 데이터 관련 기사는 로봇이 담당하고, 직접 취재와 심도깊은 의견이 필요한 기사는 원래의 기자들이 담당하면 된다고 얘기한다.
워드스미스가 ‘더 뉴요커’나 ‘뉴욕 타임즈’의 기자를 대신하리라고는 생각하지 않는다. 대신 워드스미스는 하나의 산업을 새롭게 바꿀 수 있는 좋은 도구가 될 수 있다. 앨런은 향후 5년 안에, 데이터 분석가와 데이터 과학자들의 역할이 지금과는 완전히 바뀌어 있을 거라고 얘기한다. 즉, 데이터를 사람이 직접 분석해서 리포트를 작성하는 역할이 아니라, 워드스미스를 효과적으로 작동하게 하는 프로그래밍이 주 업무가 될 것이라는 얘기다.

다른 전망도 있다. UNC 대학에서 저널리즘을 맡고 있는 라이언 손버그 교수는 “우리는 미래에 사용자 데이터와 그들의 소셜 네트워크 데이터가 결합되어 만들어진 개인 사용자별 맞춤 기사들을 보게 될 것이다.”고 전망했다. 앨런 역시 이 생각에 동의했다.  ‘인공지능을 이용한 기사 작성’은 지금의 미디어가 제공하지 못하는 특별한 서비스를 제공할 수 있을 것이다. 바로 ‘개인기자’라는 개념이다.
즉, 부자들은 워드스미스가 만들어 내는 고도로 개인화된 뉴스 기사를 프리미엄 구독료를 내고 보게 된다. 반대로 가난한 사람들은 인간 기자들이 생산한 일반 기사를 보게 될 것이고. 결국은 로봇 기자는 부자와 가난한 자들을 가르는 미디어 세상을 만들지도 모른다.

 

원문 : http://mashable.com/2014/07/01/robot-reporters-add-data-to-the-five-ws/
번역 : 김남국 / 에디팅 : 김정철