人工智能掘金熱中 第四范式想把AI做成人人能用的應(yīng)用

掘金熱時(shí),挖金人無數(shù),賣水的賺了錢。在AI熱潮中,戴文淵想讓第四范式做那個(gè)賣水人。
01、想做AI界的甲骨文
第四范式,戴文淵所有的野心就嵌在這個(gè)名字里。
范式是科學(xué)用語,人類科學(xué)研究的發(fā)展經(jīng)歷了四個(gè)范式,第四種范式是數(shù)據(jù)科學(xué),即讓計(jì)算機(jī)總結(jié)規(guī)律的數(shù)據(jù)密集型科學(xué)。第四范式的名稱就來源于此。
范式也是計(jì)算機(jī)專業(yè)術(shù)語,數(shù)據(jù)庫通過三大范式來優(yōu)化數(shù)據(jù)存儲(chǔ)方式。在數(shù)據(jù)庫企業(yè)解決方案領(lǐng)域,市值1900多億美元的甲骨文,是一座難以攀越的高山。
第四范式創(chuàng)始人兼CEO戴文淵希望做人工智能時(shí)代的甲骨文,為企業(yè)及合作伙伴服務(wù)產(chǎn)業(yè)的公司提供既好用又有壁壘的技術(shù)服務(wù)。
“大部分人想做服務(wù)器,因?yàn)楸趬静桓?好用歸好用,我可以再做一個(gè)和你競爭。但是,好用的甲骨文數(shù)據(jù)庫沒有人想著再做一個(gè)。”戴文淵對(duì)新經(jīng)濟(jì)100人說。
第四范式創(chuàng)始人兼CEO戴文淵
他意識(shí)到,企業(yè)服務(wù)不僅要產(chǎn)品好用、有價(jià)值,還得有技術(shù)壁壘。“甲骨文作為傳統(tǒng)的企業(yè)服務(wù)公司,仍然有這樣的收入、這樣的估值。我認(rèn)為AI的天花板不會(huì)比這個(gè)低。”按照他的設(shè)想,像甲骨文有個(gè)數(shù)據(jù)庫體系一樣,第四范式未來將有個(gè)AI體系。
這個(gè)體系不是“煙囪式”的創(chuàng)新,按垂直行業(yè)劃分,從頭做到尾,提供端到端的解決方案。而是不同要素像積木一樣疊加,成為通用的平臺(tái)。
02、“先知”的進(jìn)化
第四范式所有產(chǎn)品線圍繞一個(gè)名為「第四范式先知」(以下簡稱「先知」)的平臺(tái)。
“先知”的設(shè)計(jì),來源于學(xué)習(xí)圈理論。學(xué)習(xí)圈是大衛(wèi)·庫伯總結(jié)了前人經(jīng)驗(yàn)之后提出的經(jīng)驗(yàn)學(xué)習(xí)模型,包括具體經(jīng)驗(yàn)、反思性觀察、抽象概念化、主動(dòng)實(shí)踐四個(gè)環(huán)節(jié),體現(xiàn)了學(xué)習(xí)的完整流程。
學(xué)習(xí)圈理論
以“先知”平臺(tái)上的反欺詐為例,如何訓(xùn)練機(jī)器自動(dòng)識(shí)別一筆交易是正常交易,而不是盜刷信用卡呢?
首先輸入很多歷史交易數(shù)據(jù),這些交易行為會(huì)有反饋,盜刷會(huì)有電話投訴,沒有被投訴的交易可以判斷是正常的。這些反饋交給機(jī)器學(xué)習(xí)做反思,反思不是剖開機(jī)器大腦做神經(jīng)元連接,而是運(yùn)用AutoML技術(shù),把行為數(shù)據(jù)和反饋數(shù)據(jù)導(dǎo)入機(jī)器,反思出一個(gè)模型,自動(dòng)產(chǎn)生理論總結(jié),知道什么情況是正常交易,什么情況是欺詐。最后,把這個(gè)模型做成線上系統(tǒng)。新的交易數(shù)據(jù)過來,機(jī)器就會(huì)判斷它是否是欺詐。
這就是完整的學(xué)習(xí)圈過程,其中,反欺詐可以替換成醫(yī)療、金融、政府、能源等各行業(yè)的應(yīng)用。
類似紡織業(yè)從手工縫制變成了工廠流水線生產(chǎn),AI的落地演進(jìn)也會(huì)走上社會(huì)化分工再提煉的必由之路。
第四范式聯(lián)合創(chuàng)始人兼產(chǎn)品負(fù)責(zé)人胡時(shí)偉打了個(gè)比方,現(xiàn)在一些公司給客戶提供AI解決方案,相當(dāng)于裁縫上門給客戶量衣服。在某個(gè)行業(yè)落地相當(dāng)于預(yù)先做好一些版型,批量生產(chǎn)。
而第四范式想做的,是打造制衣廠生產(chǎn)線,多個(gè)版型的衣服都能在這條生產(chǎn)線上生產(chǎn)。
要實(shí)現(xiàn)這個(gè)目標(biāo),第四范式花費(fèi)了三年時(shí)間來摸索路徑,讓「先知」升級(jí)換代。
機(jī)器學(xué)習(xí)的核心是模型具備判斷能力,建模技術(shù)門檻比較高,一般都由AI專家來做,“先知”1.0就是取代AI專家的建模工具。
在企業(yè)落地的時(shí)候,第四范式發(fā)現(xiàn)只是建模還不夠,數(shù)據(jù)的來源、生成的模型如何上線都需要解決。于是,“先知”2.0向前向后各增加一環(huán)節(jié),前接數(shù)據(jù)進(jìn)來,后可生成服務(wù)。
從“先知”1.0到2.0,從建模工具到全流程開發(fā)平臺(tái),由于沒有對(duì)功能抽象提煉,導(dǎo)致后來出現(xiàn)問題:作為一個(gè)工具,每個(gè)部分都要單獨(dú)做,項(xiàng)目太多了。
AI在一家企業(yè)里的應(yīng)用,應(yīng)該是一片森林,而不只是一棵樹。那么如何批量植樹造林?
到了“先知”3.0,第四范式提出核心系統(tǒng)的概念,把數(shù)據(jù)和應(yīng)用之間的關(guān)系都連接在這個(gè)核心系統(tǒng)上,從獲客到營銷,從風(fēng)控到留存,從安全到員工體驗(yàn),到上下游的供應(yīng)鏈等各個(gè)環(huán)節(jié),全部都用一套系統(tǒng)。
“1.0相當(dāng)于我們造了一個(gè)發(fā)動(dòng)機(jī),結(jié)果發(fā)現(xiàn)發(fā)動(dòng)機(jī)開不了,自己還得手動(dòng)組裝車,2.0相當(dāng)于我們弄了一個(gè)生產(chǎn)車的手工作坊,一輛一輛地造車,3.0相當(dāng)于弄了一套生產(chǎn)線,可以生產(chǎn)各種不同型號(hào)的車,是一個(gè)再擴(kuò)展的過程。”胡時(shí)偉對(duì)新經(jīng)濟(jì)100人說。
“先知”3.0另一個(gè)重要改變是,把開發(fā)和運(yùn)行區(qū)隔開了。AI企業(yè)做企業(yè)服務(wù)業(yè)務(wù),通常派人去客戶現(xiàn)場做,大家對(duì)于AI外包的業(yè)務(wù)形態(tài)有過不少激烈的爭執(zhí)。
“軟件知識(shí)產(chǎn)權(quán)的開發(fā)和運(yùn)行沒有分開,缺少一套方法論和語言去定義,什么叫AI應(yīng)用。比如手機(jī)上的App,下載就可以使用。但是AI現(xiàn)在還做不到下載一個(gè)營銷應(yīng)用就可以直接使用。先知3.0就是要定義一種可下載使用的AI應(yīng)用,實(shí)現(xiàn)行業(yè)內(nèi)的復(fù)制。”胡時(shí)偉說。
同時(shí),第四范式提供開發(fā)工具,讓合作伙伴在各自行業(yè)內(nèi)開發(fā)應(yīng)用。應(yīng)用開發(fā)出來后,通過相關(guān)載體,企業(yè)拿去安裝即可,不需要派人到每家企業(yè)部署實(shí)施。
這種方式成為第四范式商業(yè)化的重點(diǎn)。
沒有甲骨文之前,企業(yè)想用數(shù)據(jù)庫,就需要自己開發(fā)。甲骨文首先推出了商用SQL(結(jié)構(gòu)化查詢語言),后來,大家都做SQL語句,語句最后形成了應(yīng)用。第四范式認(rèn)為AI應(yīng)用的發(fā)展,也將類似。
那么,一個(gè)AI應(yīng)用應(yīng)該是怎樣的?
“我們利用學(xué)習(xí)圈理論,通過數(shù)據(jù)的采集、標(biāo)注、機(jī)器學(xué)習(xí)和模型上線四個(gè)部分,定義一個(gè)AI應(yīng)用。最早企業(yè)做信息化都是外包,沒有SAP,沒有eHR,這些軟件后來才出現(xiàn)。各行各業(yè)定義出AI應(yīng)用后,推而廣之,就可以解決現(xiàn)在做AI就是外包的問題。”胡時(shí)偉說。
做toB業(yè)務(wù),難免會(huì)遇到客戶提出各種需求。在AI應(yīng)用早期,客戶的理解經(jīng)常會(huì)有偏差,有時(shí)候客戶提出來的需求需要轉(zhuǎn)化。
第四范式團(tuán)隊(duì)經(jīng)常遇到這種情況:客戶說要A,第四范式說你要的是B??蛻赳R上說,對(duì)對(duì)對(duì),我要的是B。
舉例來說,客戶對(duì)第四范式提過一個(gè)需求,能不能把公司數(shù)倉數(shù)據(jù)導(dǎo)入進(jìn)來,用數(shù)倉數(shù)據(jù)來建模。實(shí)際上,數(shù)倉數(shù)據(jù)是為BI設(shè)計(jì)的,用BI里的數(shù)據(jù)做AI,基本都慘不忍睹。因?yàn)锽I是報(bào)表數(shù)據(jù),是給人看的,AI的數(shù)據(jù)是給機(jī)器看的。
于是,第四范式給客戶分析投入產(chǎn)出比,用數(shù)倉數(shù)據(jù)不如直接從生產(chǎn)系統(tǒng)上重新采集數(shù)據(jù)。從生產(chǎn)線拿過來的原始數(shù)據(jù),不需要預(yù)處理,最適合機(jī)器學(xué)習(xí)。BI的數(shù)據(jù)經(jīng)過復(fù)雜的聚合,信息量丟失了,機(jī)器反而訓(xùn)練不好。
對(duì)企業(yè)來說,解決方案的方法論和交互越簡單越好。第四范式的工程和算法團(tuán)隊(duì)很大一部分精力,是為了減少客戶的操作步驟,為了讓模型更普適,讓應(yīng)用更廣泛。
當(dāng)前,第四范式產(chǎn)品按照學(xué)習(xí)圈理論,構(gòu)建數(shù)據(jù)、算法和生產(chǎn)三大核心,給企業(yè)客戶提供包括行為數(shù)據(jù)、反饋數(shù)據(jù)、模型訓(xùn)練和模型應(yīng)用在內(nèi)的全流程應(yīng)用。客戶點(diǎn)擊進(jìn)去進(jìn)行簡單操作,就可以得到想要的應(yīng)用服務(wù)。
AI能夠發(fā)揮作用的關(guān)鍵是數(shù)據(jù)。企業(yè)接入“先知”平臺(tái)之前,如果沒有數(shù)據(jù)積累,往往有一個(gè)收集數(shù)據(jù)的過程。
“我們認(rèn)為一千萬條以上的數(shù)據(jù)很大概率能達(dá)到比人好的效果,一千萬條數(shù)據(jù)意味著機(jī)器可以寫一千萬條規(guī)則。人最多可能寫幾十到幾百條,如果機(jī)器寫的規(guī)則數(shù)比人寫的規(guī)則數(shù)多幾個(gè)量級(jí)時(shí),就能達(dá)到一個(gè)比較好的效果。”第四范式首席研究科學(xué)家陳雨強(qiáng)說。
按照戴文淵的設(shè)想,“先知”平臺(tái)的發(fā)展,將從數(shù)據(jù)輸入變?yōu)闃I(yè)務(wù)輸入。只需要把企業(yè)的業(yè)務(wù)目標(biāo)告訴機(jī)器,機(jī)器就可以從企業(yè)數(shù)據(jù)倉庫中創(chuàng)造出業(yè)務(wù)價(jià)值。
其產(chǎn)品設(shè)計(jì)的邏輯在于,內(nèi)部越做越復(fù)雜,對(duì)外越來越簡單。
03、從競爭走向合作
2015年初,第四范式公司剛成立,戴文淵就想著做銀行。周圍的人覺得他異想天開,銀行不可能和一家剛成立的小公司合作。
戴文淵直接與招商銀行營銷部的一位負(fù)責(zé)人溝通,介紹互聯(lián)網(wǎng)公司的營銷方式,他在百度時(shí)是如何做營銷的。當(dāng)時(shí),百度采用了機(jī)器學(xué)習(xí)的方式,帶來效益8倍的提升。
戴文淵問對(duì)方,招行模型如何制定,得到的回答是有專家在寫營銷規(guī)則,兩百多條。
戴文淵說,你知道百度有多少條嗎?一千億條。通過機(jī)器,我現(xiàn)在能給你做到一千萬條。
銀行需要在持卡群體里找到有分期需求的客戶,通過打電話、發(fā)短信或者微信推送的方式進(jìn)行營銷。銀行的營銷渠道資源容量有限,只能從數(shù)千萬持卡人中挑出一小部分意愿比較強(qiáng)、有較大分期需求的客戶,做出投入產(chǎn)出比更高的選擇。
機(jī)器學(xué)習(xí)可以從幾千萬人里精準(zhǔn)找到這類客戶,優(yōu)先撥打他們的電話。同樣打十萬個(gè)電話,有多少客戶響應(yīng)了電話營銷,這個(gè)響應(yīng)率或者營銷成功率是最終判斷機(jī)器學(xué)習(xí)模型是否有效的核心業(yè)務(wù)指標(biāo)之一。
后來,第四范式為招行信用卡中心做了五千萬條營銷規(guī)則,上線以后收入提升60%。
有了招商銀行作為標(biāo)桿案例,第四范式陸續(xù)拿下了國內(nèi)幾家大型信用卡中心,為它們提供精準(zhǔn)營銷服務(wù)。
之后,第四范式不斷擴(kuò)張業(yè)務(wù),從精準(zhǔn)營銷擴(kuò)散到反欺詐、定價(jià)等銀行業(yè)務(wù)的各個(gè)環(huán)節(jié),再從銀行擴(kuò)展到能源、政府、醫(yī)療、零售等各個(gè)行業(yè),如今客戶近2000家。
企業(yè)服務(wù)依賴公司交付團(tuán)隊(duì)的規(guī)模,第四范式試圖通過合作伙伴模式打破限制。
“交付團(tuán)隊(duì)的規(guī)模決定我們業(yè)務(wù)成長的速度,我們需要一個(gè)生態(tài)圈幫助我們更快速、更大范圍地落地。靠自身能力擴(kuò)張市場,邊界總是有的,合作伙伴幫我們彌補(bǔ)了自身能力覆蓋不到的邊界外部分。”第四范式咨詢合伙人柴亦飛說。
選擇合作伙伴這種模式,也是為了在各行業(yè)快速落地的變通。
對(duì)創(chuàng)業(yè)公司來說,風(fēng)卷殘?jiān)瓢?ldquo;洗劫”某個(gè)行業(yè),并不現(xiàn)實(shí)。原有供應(yīng)商在行業(yè)內(nèi)盤根錯(cuò)節(jié),擁有自己的一方地盤,對(duì)于橫插一杠子的新競爭者,他們會(huì)制造各種各樣的障礙。
所以,第四范式從競爭轉(zhuǎn)向合作。“做商業(yè)共贏,讓所有公司都覺得跟你合作有飯吃。要幫到別人,不要說比別人強(qiáng)。就算我真的沒辦法幫到你,那我跟你也是兩個(gè)不同的東西,咱倆沒競爭關(guān)系。”戴文淵如此劃分陣營。
現(xiàn)在第四范式的不少合作伙伴都曾經(jīng)與其有過競爭。例如,現(xiàn)在有一合作伙伴,曾跟他們競爭過廣發(fā)銀行的標(biāo)。廣發(fā)銀行的需求是反欺詐加平臺(tái),合作伙伴做的是反欺詐,第四范式是平臺(tái),最終第四范式中了標(biāo)。
后來第四范式拉上對(duì)方,形成聯(lián)合體,在第四范式平臺(tái)上開發(fā)反欺詐應(yīng)用,共同完成之后的大單。
這好比掘金熱時(shí)候,挖金子的人無數(shù),賣水的商人大賺了一筆。戴文淵想讓第四范式做掘金人背后的賣水人。
但是在賣水之前,第四范式也掘金,以此來告訴其他人,掘金是賺錢的。在通過合作伙伴滲透行業(yè)之前,第四范式自己也會(huì)做行業(yè)標(biāo)桿案例,推動(dòng)平臺(tái)在行業(yè)落地。
對(duì)手依然存在,戴文淵也有自己的競爭思路,那就是拿下行業(yè)所有標(biāo)桿。
“我們在拿下第一個(gè)標(biāo)桿招行以后,第一件事情不是去擴(kuò)大收入,而是看行業(yè)內(nèi)還有什么其他的標(biāo)桿,比如工商銀行、建設(shè)銀行、中國銀行、民生銀行、中信銀行等。”戴文淵說。
戴文淵帶著黑色框鏡,穿著黑色襯衫,透著一股理工科生的氣質(zhì)。他曾是百度最年輕的高級(jí)科學(xué)家。和新經(jīng)濟(jì)100人交流當(dāng)天,因?yàn)樯ぷ硬皇孢m連喝了三四瓶水。他努力說話,聲音不大,有些沙啞。
2005年,還在上海交通大學(xué)讀書的戴文淵,和兩位搭檔一起奪取了ACM大學(xué)生程序設(shè)計(jì)競賽世界冠軍。這項(xiàng)賽事由美國計(jì)算機(jī)協(xié)會(huì)(ACM)主辦,經(jīng)過四十多年發(fā)展,已經(jīng)成為全球最具影響力的大學(xué)生程序設(shè)計(jì)競賽。
捧回冠軍的戴文淵來不及高興,他發(fā)現(xiàn),熱門的計(jì)算機(jī)圖像學(xué)已經(jīng)被同學(xué)選完,人工智能是剩下的為數(shù)不多方向之一。他因此結(jié)緣香港科技大學(xué)計(jì)算機(jī)系主任楊強(qiáng)——華人界首位AAAI Fellow、唯一執(zhí)委,IJCAI理事會(huì)主席。2015年,戴文淵創(chuàng)業(yè),楊強(qiáng)擔(dān)任第四范式首席科學(xué)家。
在大三參加ACM比賽之前,戴文淵成績一直不太穩(wěn)定,每每到了關(guān)鍵比賽就發(fā)揮不出應(yīng)有水平。
后來他調(diào)整自己的心態(tài),控制自己的情緒,不去想那些對(duì)結(jié)果沒有幫助的事情,讓自己達(dá)到最佳狀態(tài)。
“你經(jīng)歷過最殘酷的競爭,你越是想得到,你越得不到。最高水平的競爭,大家差距是非常微小的,勝負(fù)只在一念之間。”
他發(fā)現(xiàn),比賽最重要的事情不是把自己發(fā)揮到極致,而是把團(tuán)隊(duì)發(fā)揮到極致。以前他們團(tuán)隊(duì)三個(gè)人比賽,每個(gè)人都把自己那部分做到最好,戴文淵嘗試自己做得弱一點(diǎn)為代價(jià),讓隊(duì)友做得更好。結(jié)果,團(tuán)隊(duì)強(qiáng)大了很多,也如愿收獲了世界冠軍。
由此,戴文淵學(xué)會(huì)了變通。如果方向清晰,那就一直往那個(gè)方向走,用什么方法都行,不是非要用某個(gè)方法才行。
一如第四范式的商業(yè)邏輯,無論是自己做,還是經(jīng)由合作伙伴,只要能夠進(jìn)入到企業(yè)客戶,哪一條路都行。
世界級(jí)競賽殘酷,創(chuàng)業(yè)更是。
相關(guān)文章
專訪第四范式創(chuàng)始人戴文淵:不忘初心 開創(chuàng)AI企業(yè)級(jí)服務(wù)時(shí)代
如今AI如火如荼,很多公司都打上AI的標(biāo)簽,有行業(yè)解決方案提供商,有底層硬件提供商,有做機(jī)器人的,有做智能應(yīng)用產(chǎn)品的,那么第四范式究竟是一家怎樣的AI公司?下面跟小編具體了2019-07-01