過去幾年,人工智能技術(shù)應(yīng)用不斷滲透和推廣,但真正得到驗(yàn)證的商業(yè)模式仍然有限。
在智能語音領(lǐng)域,商業(yè)化更多的是為既有行業(yè)賦能,典型應(yīng)用場景是智能硬件中的人機(jī)交互,但這一應(yīng)用價值更多來自于產(chǎn)品自身,要真正體現(xiàn)智能語音價值,需要找到合適的商業(yè)場景,呼叫中心就是其中一個理想場景。
首先,呼叫中心本身就是為了協(xié)調(diào)企業(yè)與用戶之間的溝通,對智能語音有天然的需求。
其次,目前國內(nèi)呼叫中心坐席數(shù)上百萬,通過提供智能語音服務(wù),將會有巨大的優(yōu)化空間,潛在市場巨大。
此外,對話機(jī)器人涉及語音識別、語義理解、語音合成以及一系列交互模塊,技術(shù)門檻高,隨著行業(yè)應(yīng)用不斷深入,不同行業(yè)之間也可能出現(xiàn)業(yè)務(wù)門檻,早入場的玩家將有更大機(jī)會。
靈伴科技是少數(shù)提供智能語音語言服務(wù)的AI公司,主要為金融、保險、運(yùn)營商、民航等行業(yè)大型客戶提供智能語音交互機(jī)器人。
靈伴科技成立于2014年,核心團(tuán)隊成員在語音領(lǐng)域有十幾年技術(shù)積累,成立之初就定位于技術(shù)創(chuàng)業(yè),以智能語音改變傳統(tǒng)呼叫中心。
傳統(tǒng)呼叫中心主要在三個方面跟智能結(jié)合,一是質(zhì)檢分析,二是語音導(dǎo)航,三是對話機(jī)器人。經(jīng)過一年時間探索,靈伴科技將目標(biāo)鎖定在智能對話方向。
2016年7月,靈伴科技推出其核心產(chǎn)品睿思1.0,將語音識別、語義理解、語音合成,以及整套工程化對話技術(shù)整合封裝提供給企業(yè)用戶,靈伴科技業(yè)務(wù)步入正軌。
時隔一年之后,靈伴科技又推出了睿思2.0版本,在技術(shù)、應(yīng)用、產(chǎn)品上更新迭代,目前靈伴科技已經(jīng)積累起一批保險、運(yùn)營商、民航、教育、銀行等行業(yè)客戶。
作為一家創(chuàng)業(yè)公司,靈伴科技回避大而全的綜合解決方案,更多提供基于特定場景的產(chǎn)品服務(wù),如保單回訪、續(xù)保通知、滿意度調(diào)查等特定場景下的智能語音交互服務(wù)。
到目前為止,靈伴科技已經(jīng)能夠提供100多個應(yīng)用場景,新場景開發(fā)平均僅需要數(shù)小時。
在收費(fèi)方式上,靈伴科技按照訂閱模式付費(fèi),客戶按照需要的對話機(jī)器人數(shù)量付費(fèi),隨用隨開。
靈伴科技創(chuàng)始人陳博認(rèn)為,未來AI領(lǐng)域的競爭一定會深入業(yè)務(wù)場景,只有在行業(yè)內(nèi)足夠深耕,積累起足夠的數(shù)據(jù)和行業(yè)知識,才能在AI大潮真正到來時站穩(wěn)腳跟。
為此,靈伴科技在呼叫中心業(yè)務(wù)之外,也探索智慧醫(yī)療,智能硬件的應(yīng)用,將AI廣泛賦能上述領(lǐng)域。在發(fā)揮基礎(chǔ)AI技術(shù)優(yōu)勢的前提下,逐步構(gòu)建靈伴AI生態(tài)。
近期,愛分析對靈伴科技創(chuàng)始人陳博進(jìn)行訪談,他對靈伴科技的業(yè)務(wù)模式、目標(biāo)客群、未來戰(zhàn)略,以及智能客服行業(yè)的未來展望做了詳細(xì)介紹,現(xiàn)將精彩內(nèi)容分享如下。
傳統(tǒng)呼叫中心與智能語音結(jié)合,對話機(jī)器人潛力巨大
愛分析:請您大概介紹一下靈伴科技的發(fā)展歷程。
陳博:我們核心團(tuán)隊在語音語言上有十多年的積累,2013年底,我們團(tuán)隊參加語音合成領(lǐng)域全球最權(quán)威的比賽“Blizzard Challenge”,并取得第一名的好成績。
為了實(shí)現(xiàn)智能語音語言的技術(shù)價值,我們整合語音識別、語言理解、語音合成技術(shù),形成一個真正能解決人問題的對話機(jī)器人。當(dāng)時面臨的直接問題是產(chǎn)業(yè)化,語音交互能力可以結(jié)合的行業(yè)非常多,比如像智能音箱、智能家具、車聯(lián)網(wǎng)等等。
這些領(lǐng)域都有廣泛的應(yīng)用空間,但我們經(jīng)過深入分析,最后選擇了客服行業(yè)中的呼叫中心。
選擇這個領(lǐng)域最大的邏輯是我們認(rèn)為語音客服最能代表語音交互能力的價值。而其他領(lǐng)域,比如智能音箱,它的核心價值是云端資源,而不是語音交互的能力。所以,靈伴科技2014年成立時,就專注在智能客服這個領(lǐng)域。
在發(fā)展過程中,我們也做了廣泛的探索。傳統(tǒng)呼叫中心主要在三個方面跟智能結(jié)合,一是質(zhì)檢分析,二是語音導(dǎo)航,三是對話機(jī)器人。
我們最早做的,是客服領(lǐng)域最常見的也是需求量最大的語音質(zhì)檢,后來發(fā)現(xiàn)語音質(zhì)檢不是一個好業(yè)務(wù)形態(tài)。智能質(zhì)檢的核心功能是通過事后錄音判斷誰在說話,說了什么,態(tài)度好不好,最終提升服務(wù)質(zhì)量,但它的市場空間有限。
舉個例子,一個一萬人的呼叫中心一般會配80-100個質(zhì)檢員,那語音質(zhì)檢產(chǎn)品最多替代這80-100個質(zhì)檢員。從另外一個角度來講,提升管理質(zhì)量有很多途徑的,技術(shù)只是其中一種而已,所以它的剛性并沒有那么強(qiáng)。
我們同樣看到,語音導(dǎo)航產(chǎn)品也不適合,語音導(dǎo)航取消按鍵能夠提升客戶體驗(yàn),但語音導(dǎo)航每1級按鍵不超過10個,一般不超過3級,替換的價值有限,而且呼叫中心都包括IVR功能,用戶的剛性并不大。
我們在行業(yè)里探索了不到一年,在2015年上半年,我們果斷鎖定對話機(jī)器人。
2016年7月,經(jīng)過一年時間打磨產(chǎn)品,我們將語音識別、語言理解、語音合成,還有整套工程化對話技術(shù)全部整合封裝推出了睿思1.0,標(biāo)志著我們整個產(chǎn)品從研發(fā)過渡到市場,并開始對接大量業(yè)務(wù)。
2017年11月,我們又推出了睿思2.0,包括一些技術(shù)、應(yīng)用、產(chǎn)品上的創(chuàng)新。
同時,我們孵化了一些新的方向,包括智能醫(yī)療、智能硬件。因?yàn)槲覀儽旧硎莿?chuàng)業(yè)公司,資源相對有限,所以我們在孵化新產(chǎn)品的時候有一個周期,目前的呼叫中心智能客服方向,我們覺得已經(jīng)孵化的比較成熟,現(xiàn)在進(jìn)入到快速市場推廣的階段。
愛分析:除了保險,現(xiàn)在還面向哪些行業(yè)?
陳博:保險、銀行、運(yùn)營商、民航、教育這樣的大行業(yè)。
愛分析:對話機(jī)器人主要涉及到哪些技術(shù)?
陳博:主要是涉及語音識別、語義理解和語音合成。
我們做的是整個對話機(jī)器人,這幾個模塊不能分開。 現(xiàn)在行業(yè)里好多做機(jī)器人的都是用第三方的語音平臺做識別,然后拿關(guān)鍵詞做理解,最后搞錄音,這極其不負(fù)責(zé)任。
第一,從語音識別來講,通用的語音識別一定沒有專業(yè)領(lǐng)域的語音識別效果好,在保險行業(yè)、銀行行業(yè)要做好一定需要引擎,然后通過不斷學(xué)習(xí)提升識別率;語義理解也是一樣,要在限定領(lǐng)域才能做的好。
第二,從語音合成來講,合成質(zhì)量不好的話用戶是能夠感覺出來。很多人覺得錄音比對話機(jī)器人效果要好,這不對,一個對話機(jī)器人的核心能力是快速迭代和升級,不可能靠錄音包打天下?,F(xiàn)在行業(yè)里迅速出現(xiàn)了一批錄音對話機(jī)器,它們沒有技術(shù),就是拿錄音簡單替代語音合成,無法適用動態(tài)對話內(nèi)容,應(yīng)用場景非常有限。
實(shí)際上電話渠道是智能客服所有渠道里面最難的一個,我們做對話機(jī)器人的初衷就是因?yàn)殚T檻高,我們可以把產(chǎn)品打造好。
語義理解是智能客服的重點(diǎn)和難點(diǎn),需要數(shù)據(jù)與行業(yè)知識積累
愛分析:最開始做睿思這款產(chǎn)品時,基礎(chǔ)數(shù)據(jù)的積累會有難度嗎?
陳博:我們早期項目做的比較艱難,數(shù)據(jù)也是靠一點(diǎn)點(diǎn)積累,所以睿思1.0就研發(fā)了一年多,從1.0到2.0又花了一年多時間。
我們到現(xiàn)在2.0再去做新的項目就非???,現(xiàn)在一個新的對話流程,我們內(nèi)部可以在數(shù)小時內(nèi)完成原型開發(fā)。
愛分析:要積累多少數(shù)據(jù),才能跑出一個相對可以的模型?
陳博:語音至少要上萬小時。
愛分析:一般一個客戶上線大概需要多長時間?
陳博:我們可以控制在一周以內(nèi),但是現(xiàn)在這個時間都是卡在客戶那,客戶要準(zhǔn)備線路,準(zhǔn)備對接。
愛分析:會和客戶的語料庫對接嗎?
陳博:不用,我們會提供的一個具備一定行業(yè)知識積累的語料庫,如果要求客戶有一個做得比較好的語料庫,那對他要求太高了,會阻礙項目落地速度。
我們能做到這一步也是因?yàn)閷π袠I(yè)知識的大量積累。
愛分析:這樣看來,新開一個行業(yè)的難度還是挺大?
陳博:從對話上來看,很多知識是跨行業(yè)的,并不是不同行業(yè)就需要重新積累,比如做新車購買的回訪和車險的回訪,核心都是車相關(guān)的領(lǐng)域概念。
另外在在言語表達(dá)上,各個行業(yè)調(diào)查問卷都以是否這樣的意見詢問為主,有大量可重復(fù)的知識。
愛分析:我們現(xiàn)在看到各類的公司都在進(jìn)入這個領(lǐng)域,目前智能客服行業(yè)大概能分成幾類玩家?
陳博:在我看來大概分這幾類。第一類,是像我們這樣做語音技術(shù)起家的公司,比如科大訊飛、捷通華聲,特點(diǎn)是相對比較沉穩(wěn),靠產(chǎn)品技術(shù)取勝。
第二類,是傳統(tǒng)呼叫中心的IT廠商,如合力億捷、天潤,他們的優(yōu)勢在于呼叫中心領(lǐng)域的客戶與技術(shù)積累,能提供云通訊平臺、云坐席,也賣系統(tǒng)。它們在行業(yè)積累時間最長,最知道哪里能賺錢,但是他們在AI技術(shù)方向的積累是短板。
第三類,是傳統(tǒng)的IT廠商,比較有代表性是中科匯聯(lián)等,他們有現(xiàn)成的IT能力,呼叫中心這些系統(tǒng)都能實(shí)現(xiàn)。
第四類,是AI互聯(lián)網(wǎng)創(chuàng)業(yè)企業(yè),比如智齒、追一,它的創(chuàng)始人不一定是語音出身,但可能有在BAT工作經(jīng)驗(yàn),在系統(tǒng)架構(gòu)、互聯(lián)網(wǎng)思維上有相應(yīng)積累。
愛分析:從AI切入智能客服的企業(yè)中,再去拆的話能分成幾類?
陳博:再去拆的話,就是按照文本和語音分類。我們跟科大訊飛、捷通華聲一樣,提供文本和語音綜合方案。
實(shí)際上,智能客服最有價值也是難度最大地方是在語音客服。但是大多數(shù)智能客服公司,包括云通訊公司,他們都只提供文本客服。
文本客服受渠道特點(diǎn)所限,適合被動式、呼入式客戶服務(wù),而且文本客服解決的還是FAQ問題,而以前客戶網(wǎng)站就自帶FAQ,這種替代的剛性不強(qiáng),價值也有限。
文本客服跟語音客服另外一個區(qū)別就是,語音客服是主動服務(wù),文本客服沒法主動服務(wù),比如網(wǎng)頁彈出一個你好,你是不會跟他交流的。語音則更像人工客服的能力,所以定價本質(zhì)上也不一樣。
主攻特定場景,創(chuàng)業(yè)公司拿下大型企業(yè)訂單
愛分析:靈伴主要是直銷還是通過渠道獲客?
陳博:我們直銷多。
實(shí)際上,渠道方像BPO對機(jī)器人的敏感程度要高過真正甲方,因?yàn)锽PO作為乙方一旦出現(xiàn)問題,單子可能就丟了,因此它們更敏感。
我們目前主要是做直客,當(dāng)我們做到一定規(guī)模,甲方也廣泛使用了,那BPO也就愿意接受機(jī)器人。
愛分析:靈伴給客戶提供標(biāo)準(zhǔn)產(chǎn)品還是項目服務(wù)?
陳博:我們提供的是一套軟件產(chǎn)品,但是如果按照傳統(tǒng)的軟件銷售的模式的話,有幾個問題。
第一,這一套產(chǎn)品包括語音識別引擎、合成引擎、語言理解引擎三個最基本的引擎,在這之上還有對話模塊、監(jiān)控模塊、統(tǒng)計分析模塊、用戶管理模塊,整套系統(tǒng)按常規(guī)軟件報價,沒有300萬下不來。任何一個客戶說20多個機(jī)器人打兩個月電話要300萬,這個商業(yè)邏輯不成立。
第二,如果走采購立項的話,客戶采購周期太長,對于創(chuàng)業(yè)公司來說不利。
第三,創(chuàng)業(yè)公司在市場品牌知名度等方面不占優(yōu)勢。
所以我們整個商業(yè)模式做了很大改革,就是不管是公有云還是私有化部署,我們都可以按路(對話機(jī)器人并發(fā)數(shù))租用,客戶不用立項,只要我們的機(jī)器人干得好,客戶就持續(xù)地用,不滿意可以隨時停工。
正常情況下,這種大B客戶對我們的服務(wù)會越用越多,根本不擔(dān)心它過兩個月不用。比如我們最早的保險公司客戶,它用我們的機(jī)器人節(jié)省了好多成本,后來就開始拓展第二第三個場景,到最近找到我們希望能解決呼入場景。
愛分析:除了呼叫中心,靈伴科技下一步會往哪些領(lǐng)域延伸?
陳博:我們還會豐富我們對話機(jī)器人的智能交互能力,比如說我們把保險行業(yè)中的財險、壽險都做了,還把銀行客戶搞定,再進(jìn)入到民航客服,這些場景都積累完之后,實(shí)際上我們的客服平臺就具備了生活中各方面的知識。
未來,我們會再進(jìn)一步把它延伸成面向個人的服務(wù)中心。為什么Siri用了一段時間大家不用了,就是因?yàn)樗闹悄芴?,只能幫助用戶搜索,而搜索這個場景太淺。但是有一天如果Siri能幫用戶訂機(jī)票、訂酒店,那它的價值是巨大的。我們的路徑是先做智能客服,積累領(lǐng)域知識,然后再做面向C端個性化虛擬智能秘書。
愛分析:靈伴科技開發(fā)新場景,一般是出于哪些需求?
陳博:一般是人工難以應(yīng)付的場景,比如說壽險在中國有一個特色,叫開門紅,就是一季度的保單量要超出全年保單量50%以上。這時候保險公司的回訪量就劇增,一季度累死,四季度閑死,但如果裁員的話,明年一月又要提前招人、培訓(xùn),這對保險公司是一筆不小的投入,這就是需求。
另外就是,很多產(chǎn)品已經(jīng)互聯(lián)網(wǎng)化,保險叫互聯(lián)網(wǎng)保險,金融叫互聯(lián)網(wǎng)金融,它不只是渠道的改變,產(chǎn)品形態(tài)有很大變化,隨之而來的服務(wù)形態(tài)也有很大變化。比如半夜在OTA網(wǎng)站上定了一個歐洲游項目,與這個網(wǎng)站合作的保險公司可能會推送一個合適的短期險產(chǎn)品,用戶希望在深夜咨詢,那么這就產(chǎn)生了新的要求。
還有,很多保險是在場景上發(fā)生的,比如保險公司根據(jù)APP的反饋你要去機(jī)場,給你推一個短期險,這個時候客服服務(wù)也是隨之而來的需求。
愛分析:靈伴科技現(xiàn)在積累了多少個場景?
陳博:我們已經(jīng)做了上百個場景。
愛分析:現(xiàn)在團(tuán)隊規(guī)模如何?
陳博:現(xiàn)在50多人,以產(chǎn)品研發(fā)人員為主,有少量銷售人員。
AI領(lǐng)域不是拼人數(shù),更多的是拼算法跟創(chuàng)新,像語音識別、語音合成技術(shù)方案,都是我們自主研發(fā)的核心技術(shù),具有完整知識產(chǎn)權(quán)和技術(shù)專利等。
愛分析:最近會考慮再做下一輪融資?
陳博:是的,我們剛剛啟動新一輪融資。
愛分析:子公司單獨(dú)融資是出于什么考慮?
陳博:從技術(shù)特點(diǎn)來說,AI可以結(jié)合的點(diǎn)非常多,不同的領(lǐng)域玩法也不同,比如智能硬件更多是賣硬件,智能客服賣的是服務(wù)運(yùn)營能力。再往前走,技術(shù)越來越成為產(chǎn)品的一部分,而企業(yè)的產(chǎn)品形態(tài)拼的是綜合解決能力,包括在該領(lǐng)域內(nèi)的知識積累。
未來智能客服領(lǐng)域也一樣,會存在行業(yè)門檻,比如在保險、銀行領(lǐng)域就可能會有一兩家做的非常專業(yè)的公司,別的智能客服廠商打不進(jìn)來,我們希望成為這樣的一家公司。
另外一點(diǎn)考慮,我們希望可以成為將領(lǐng)域知識和AI深度融合的智能客服公司,為行業(yè)客戶帶來AI生產(chǎn)力,升級傳統(tǒng)客服。