少兒編程 > 文章資訊 > 機器人 > 圖靈機器人:如何成為QQ的群聊機器人?
圖靈機器人:如何成為QQ的群聊機器人?
童程童美 2017-03-09
曾聽見一位對話機器人公司的老總抱怨自己雖然有一個好的算法卻苦于沒有數據,于是在微信群內廣發“英雄帖”,詢問誰能為其介紹大數據資源??梢姶髷祿呀洺蔀槿斯ぶ悄芷髽I創業最為關鍵的要素,雖不能說得大數據者得天下,但得大數據者至少在創業的道路上已經成功了一半。
摘要曾聽見一位對話機器人公司的老總抱怨自己雖然有一個好的算法卻苦于沒有數據,于是在微信群內廣發“英雄帖”,詢問誰能為其介紹大數據資源??梢姶髷祿呀洺蔀槿斯ぶ悄芷髽I創業最為關鍵的要素,雖不能說得大數據者得天下,但得大數據者至少在創業的道路上已經成功了一半。
當市面上的大多人工智能公司都在買數據時,我們不僅不需要買數據,甚至都已經可以賣了。
圖靈機器人 COO 郭家表示圖靈機器人最大的優勢便是擁有全球頂級的中文對話語庫。據介紹,目前圖靈機器人已經擁有40多萬的開發者,積累了 1300 多億條語料庫,而且值得一提的是這是對話語料庫,極少有其他公司能達到這樣的量級。那么圖靈機器人是如何做到的呢?
一切都得從蟲洞語音助手說起。
蟲洞語音助手 是圖靈機器人于 2012 年正式發布的類似于蘋果 Siri 的對話機器人,其具備語義搜索、智能問答、語音控制等功能,旨在解決用戶生活中遇到的各種問題,幫助用戶快速獲取信息。作為國內較早的語音助手工具之一,“蟲洞語音助手”于 2012 年 3 月推出第一版,當月就有 40 萬的用戶注冊,產品一炮走紅。而到 2013 年 5 月,蟲洞日活躍用戶度約為 15%,總用戶量接近 1000 萬。
不過,在面對良好發展勢頭的同時,圖靈也注意到了背后潛藏著的隱患。“我們發現就連 Siri 的體驗也都還不夠好。”郭家表示。
據了解,蟲洞語音助手能正確地完成用戶提出的任務和要求,但也不完善,很多時候蟲洞能將連續提出的幾個問題進行關聯,經常只是機械地對每一個問題進行回答,不能區分用于無聊調戲的聊天模式以及正常使用的問答模式。
尚不完善的體驗無法長久地留住用戶。據了解,圖靈本預期 2013 年蟲洞語音助手的用戶將增長到 5000 萬,但實際上在 2014 年 11 月動點科技對其進行報道時,蟲洞的注冊用戶也才只有 3500 萬。顯然,純粹地做語音助手已經不行了或者還不到時候。而圖靈其實早就意識到了這一點,為此,他們在 2014 年開放了蟲洞語音助手的后臺接口,讓合作伙伴可以在手機、電視、微信、車載、家居、導航等方面擁有自然語音處理能力,而這便是圖靈機器人。
而由 2C 變成 2B 的舉動也為圖靈帶來了第二春。據郭家介紹,2014 年蟲洞一開放,數據量便開始飆升,“差不多每月增長 1 萬個開發者,1 億多個用戶?!?
大數據促成“中文語境下智能度最高的機器人大腦”
這是圖靈機器人在自己的官網上打出的 Slogan,圖靈竟敢打出這么一個扎眼的標語,其實并不是標榜自己的技術有多么好,“現在的人工智能公司最終比拼的其實還是數據,不管是語音識別、語義識別還是視覺識別等算法 95%以上都是開源的,如果某家公司說我算法好,那只能說他們沒有找到一個會看論文文獻的人?!惫冶硎?,“大家拼的應該是數據。”
也正是在數據方面的積累使得郭家有信心表示圖靈機器人是“中文語境下智能度最高的機器人大腦”。對此,郭家認為可以從兩方面說明圖靈機器人的“聰明”:
1、準確率,即能否正確回答用戶的問題。我們對比過其他企業的產品,發現我們是最高的。資料顯示,圖靈機器人在語義識別方面的準確率可達 94.7%。
2、趣味度,用戶持續試玩的感受,這方面,我們目前至少排前三。
基于這些,最近圖靈機器人被騰訊選中,被集成到了新版的 QQ 中作為 QQ 群里的聊天機器人,輔助群主運營,“騰訊方面一下子上線幾十萬個群,剛上線最高每秒并發幾萬次,直接讓我們的流量飆升了十多個點。”郭家說到。不過,此次騰訊一共上線了兩款 QQ 群機器人,一款是圖靈機器人,而另一款則是微軟旗下大名鼎鼎的小冰機器人。
而接入中國最大的流量池之一的騰訊 QQ 之后,圖靈方面的對話數據庫顯然也會與其他競爭對手進一步拉開距離。
基于圖靈機器人,打造 Turing OS 機器人操作系統
智能手機的觸屏式交互是對傳統鍵盤式交互的革新,為此,才有了安卓等移動操作系統。而到了人工智能時代,觸摸式交互也開始落伍了,基于語音以及機器視覺等等的多模態交互才是機器人時代的主流交互手段,這是輸入方面的變化;而在輸出方面,機器人時代的輸出也已經不再只是聲音和文字,機器人的肢體動作和表情也將成為輸出的重要部分,新的交互方式決定了 OS 的框架,也意味著安卓等系統不適用于機器人,郭家認為機器人的普及也必須有專門為機器人開發的操作系統的助力。
因此,圖靈在做好主打語義理解的圖靈機器人的同時,還在機器人操作系統方向發力,以期取得更大的價值。據了解,圖靈在機器人的基礎之上整合打包了其他包括語音識別、圖像識別等友商的技術,開發了 Turing OS 機器人操作系統,旨在讓機器人開發更加簡單,開發者只需要安安心心做硬件,而不用專門找人自己開發系統軟件。
另外,郭家認為安卓系統最主要的問題就在于時延?!叭绻粋€機器人要摔倒了,系統必須即時反應,不能有延遲”,所以,Turing OS 機器人操作系統還在 kernal 和 framework 層進行了優化,以達到即時性的要求。
目前,Turing OS 除了在語義識別方面能夠達到 94.7%的準確率以外,人機對話準確率也達到了 88.2%,后者采用情感 TTS 技術,具備 25 種語言情感,包括 468 類情感語言、120 種聲音語調、88 套表情動作,官方宣稱識別準確率達到了 95.1%,可以像人一樣識別和表達情感。
操作系統的競爭是一個巨頭之間的競爭,現在包括阿里巴巴、孫正義旗下的軟銀以及谷歌和微軟都在機器人 OS 上有所發力。面對巨頭,郭家這樣告訴說到,“做 OS 的競爭一定是最頂級的,對我們而言,不要有那么大的壓力,將自己喜歡做的事情做好就可以了?!?
據了解,圖靈目前具有員工 130 余人。2016 年 1 月,其接受了奧飛動漫 5000 萬元的戰略入股。