Yupp是什么?a16z領(lǐng)投3300萬美元種子輪,Yupp融資背景及未來展望
什么是Yupp?Yupp有什么功能?Yupp有什么背景?a16z為什么領(lǐng)投3300萬美元種子輪?
隨著AI應(yīng)用深入各行各業(yè),如何準(zhǔn)確評估模型性能與提升用戶信任成了當(dāng)下亟待解決的難題。傳統(tǒng)評測多依賴集中化機制,既難以覆蓋多樣化場景,也無法反映真實用戶偏好;與此同時,模型“幻覺”問題頻出,用戶在選擇時常陷入信息繭房。
在這一背景下,Yupp作為一家新晉平臺,憑借其獨特的眾包模式和激勵機制,正試圖重塑AI模型的發(fā)現(xiàn)、比較與使用方式,并為AI評估領(lǐng)域帶來一場范式變革。本文將深入剖析Yupp的核心機制、技術(shù)亮點、團隊背景及其對AI生態(tài)的潛在影響。
下面,本文詳解其眾包評估模式、VIBE 評分系統(tǒng)、技術(shù)架構(gòu)與發(fā)展愿景,探討 AI 與 Web3 交叉的新可能。有需要的朋友一起看看吧!
團隊背景與融資:科技巨頭經(jīng)驗加持
Yupp立足于解決AI領(lǐng)域長期存在的評估難題,致力于構(gòu)建一個“去信任”(trustless)的AI反饋市場——讓多元化的用戶反饋在區(qū)塊鏈和加密經(jīng)濟激勵的保障下自由流通,從而形成一個可擴展、公平且透明的模型評估層。通過對高質(zhì)量人工標(biāo)注數(shù)據(jù)的激勵分發(fā),Yupp可以及時捕捉真實用戶在不同場景下的需求和偏好,幫助AI開發(fā)者以迭代的方式優(yōu)化模型性能。
該項目由Pankaj Gupta(聯(lián)合創(chuàng)始人兼CEO)和Gilad Mishne(聯(lián)合創(chuàng)始人兼AI負(fù)責(zé)人)于2024年6月創(chuàng)立,首席科學(xué)家Jimmy Lin(滑鐵盧大學(xué)教授)亦參與核心團隊。三人早在2010年于Twitter共事,曾打造并優(yōu)化大規(guī)模推薦與搜索系統(tǒng),后在Google和Coinbase積累了豐富經(jīng)驗。
因去中心化、數(shù)據(jù)價值透明化的愿景能夠切中AI廠商對可信評估和用戶參與的雙重訴求,以及得益于核心團隊的豐富履歷,Yupp贏得了科技行業(yè)知名人士和頂級風(fēng)投的高度認(rèn)可。
上周,Yupp宣布完成3300萬美元種子輪融資,A16z合伙人Chris Dixon領(lǐng)投,其他投資方還包括Google首席科學(xué)家Jeff Dean、Twitter聯(lián)合創(chuàng)始人Biz Stone、Pinterest聯(lián)合創(chuàng)始人Evan Sharp、Perplexity CEO Aravind Srinivas、斯坦福大學(xué)Dan Boneh、Chris Re、Nick McKeown和Balaji Prabhakar等45位知名天使及企業(yè)高管,以及Coinbase Ventures。
核心功能與用戶體驗:構(gòu)建“AI議會”
作為一個中心化的AI評估平臺,Yupp秉持“人人共享的AI(Every AI for everyone)”理念,讓用戶輕松發(fā)現(xiàn)、比較并使用最新的AI模型。與傳統(tǒng)單一響應(yīng)不同,Yupp針對每個提示同時返回兩個(乃至更多)模型的答案,形成一個“AI議會”。這種設(shè)計不僅滿足了用戶對多樣化選擇的需求,更能有效甄別模型可能出現(xiàn)的“幻覺”,幫助用戶通過對比做出更明智的決策。正如Yupp CEO Pankaj Gupta所言,并排輸出對于關(guān)注生成錯誤的用戶尤為有益,因為他們可以借此交叉驗證結(jié)果。
平臺現(xiàn)已支持逾500款A(yù)I模型,涵蓋文本與圖像生成領(lǐng)域,包括ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama等知名模型,以及眾多新興模型。為進一步優(yōu)化體驗,Yupp還推出了“QuickTake”功能,可將冗長回復(fù)提煉為一條簡潔的推文。
此外,Yupp高度重視用戶隱私:所有聊天記錄默認(rèn)私密,除非用戶主動公開;即使公開分享,也不透漏任何個人信息。用戶可隨時控制分享內(nèi)容及范圍。
經(jīng)濟模型與激勵機制:數(shù)據(jù)勞動價值化
Yupp將免費使用與用戶反饋結(jié)合,通過“Yupp積分”系統(tǒng)衡量模型使用情況。新用戶注冊秒獲5000積分,后續(xù)可通過對模型回復(fù)打分、選擇偏好并闡述理由來賺取更多積分。反饋質(zhì)量越高,獎勵越豐厚,確保用戶可持續(xù)免費使用包括Claude Opus 4或OpenAI o3等高端模型。平臺承諾,積分只增不減,且當(dāng)前所有模型皆能免費體驗。
在每次提問后,用戶會獲得兩份模型回答,并通過反饋贏取“數(shù)字刮刮卡”,獎勵0~250不等的Yupp積分。每1000積分可兌換1美元,用戶每日最高可提現(xiàn)10美元、月度最高50美元。積分支持兌換美元、歐元等20余種貨幣,合作伙伴包括Stripe、PayPal、Coinbase。同時,平臺集成了Base Ethernet L2和Solana穩(wěn)定幣,為全球用戶提供即時、免手續(xù)費的獎勵。
正如Pankaj Gupta所說,用戶產(chǎn)生的高質(zhì)量反饋對于AI公司的模型微調(diào)與強化學(xué)習(xí)價值遠(yuǎn)超獎勵本身。雖然用戶月度收益或僅相當(dāng)于幾杯咖啡,但這些付費標(biāo)注數(shù)據(jù)對AI迭代至關(guān)重要。
為激勵更多人參與,Yupp還設(shè)立推薦獎勵:推薦人獲5000積分,被推薦人獲1000積分;目前新注冊用戶可獲5000積分,被推薦人額外獲得2500積分。
Yupp VIBE評分:AI評估的新范式
針對現(xiàn)有排行榜透明度不足、公平性欠缺、評估數(shù)據(jù)獲取不均等問題,Yupp推出了測試版AI排行榜和“Yupp VIBE (Vibe Intelligence Benchmark) Score”評分系統(tǒng)。該系統(tǒng)匯聚全球用戶在自然交互中產(chǎn)生的偏好數(shù)據(jù),力求提供穩(wěn)健且可信賴的評估結(jié)果。
Yupp的評估原則包括:
- 穩(wěn)健性(Robust):保證代表性(覆蓋多樣場景)、真實性(反映用戶關(guān)切)、抗作弊性(抵御惡意行為);
- 可信賴性(Trustworthy):公平中立(對模型不偏不倚)、透明公開(詳細(xì)披露排名算法)、嚴(yán)謹(jǐn)科學(xué)(遵循評估規(guī)范)。
平臺不僅收集二元偏好,還鼓勵用戶指出回復(fù)的優(yōu)缺點(如“切中要害”、“速度快”、“風(fēng)格佳”等),并根據(jù)用戶的年齡、教育、職業(yè)等信息進行分群分析,展現(xiàn)不同群體的偏好差異。
在技術(shù)層面,Yupp正在探索利用區(qū)塊鏈、密碼學(xué)原語及零知識證明等技術(shù),確保評估過程的公正、透明和可驗證。同時,平臺已與專業(yè)AI數(shù)據(jù)提供商合作,通過檔案驗證和多層質(zhì)量檢測校準(zhǔn)評分員,清除惡意數(shù)據(jù)。
近期榜單已更新,展示了GPT?4.5 Preview、Claude Opus 4、Claude Sonnet 4等模型的VIBE得分及其勝率、不喜歡率、速度、延遲、上下文窗口和成本指標(biāo)。
發(fā)展歷程與未來展望
Yupp于2025年6月13日正式上線,前期進行了六個月內(nèi)部測試。自上線以來,產(chǎn)品持續(xù)迭代:
- 多模態(tài)支持:接入Dall?E、Flux、Stable Diffusion、Luma Photon、Google Imagen 4等模型,并支持用戶上傳圖像/PDF提問;
- 交互方式拓展:新增語音輸入與語音朗讀功能;
- 模型更新:陸續(xù)引入DeepSeek R1/V3、Mistral Small 3、OpenAI o3?pro、Hermes 3、Amazon Nova Pro v1、Microsoft Phi系列及“MAX模型”類別;
- 實時信息:將在線查詢請求路由至Perplexity和Google Gemini Live,并附帶超鏈接引文;
- 支付升級:新增美國PayPal、Venmo提現(xiàn)及24種貨幣PayPal支持;
- 分享導(dǎo)出:支持格式保留的復(fù)制、PDF/文本/Markdown導(dǎo)出,按需分享單條回復(fù)或整段對話;
- 社區(qū)活動:舉辦“AI提示挑戰(zhàn)賽”等活動,獎品最高達數(shù)萬積分;新增個人資料頁、AI自動生成的聊天名稱等功能。
Yupp的使命是“賦能人類塑造AI的未來”。Pankaj Gupta認(rèn)為,AI發(fā)展需要每個人的參與與貢獻。通過多視角AI回應(yīng)和用戶反饋,Yupp不僅助力用戶更好決策,也為AI進化提供源源不斷的動力。
值得一提的是,Yupp的主要競爭對手之一是開放AI模型評測平臺LMArena(網(wǎng)址:https://lmarena.ai/), 該網(wǎng)站在AI業(yè)內(nèi)人士中非常受歡迎,但該平臺目前正處于商業(yè)化探索階段,并沒有借用區(qū)塊鏈技術(shù)對用戶參與提供直接的物質(zhì)獎勵或積分激勵機制。
總的來說,Yupp以眾包模式、激勵機制與真實用戶偏好驅(qū)動的評估系統(tǒng),開辟了AI評估的新路徑。它不僅為用戶提供免費、多樣的AI互動體驗,更將用戶反饋轉(zhuǎn)化為高價值訓(xùn)練數(shù)據(jù),推動模型持續(xù)優(yōu)化。憑借經(jīng)驗豐富的團隊和頂級資本加持,Yupp有望在未來AI生態(tài)中扮演關(guān)鍵角色,實現(xiàn)“人人皆享AI,人人塑造AI”的愿景。
然而,對于剛剛上線的Yupp而言,如何在大規(guī)模用戶參與下,持續(xù)確保數(shù)據(jù)質(zhì)量、抵御潛在的作弊行為,以及在商業(yè)化與用戶激勵之間取得平衡,仍將是其未來發(fā)展中需要不斷探索和優(yōu)化的方向。
你可能感興趣的文章
-
Yupp是什么?a16z領(lǐng)投3300萬美元種子輪,Yupp融資背景及未來展望
Yupp是什么?Yupp有什么背景?隨著AI應(yīng)用深入各行各業(yè),如何準(zhǔn)確評估模型性能與提升用戶信任成了當(dāng)下亟待解決的難題,傳統(tǒng)評測多依賴集中化機制,既難以覆蓋多樣化場景,也…
2025-06-19 -
阿聯(lián)酋的加密貨幣戰(zhàn)略:是帝國崛起還是海市蜃樓?
阿聯(lián)酋的加密貨幣戰(zhàn)略怎么樣?是帝國崛起還是海市蜃樓?本文深入分析了阿聯(lián)酋在加密領(lǐng)域的成功,涵蓋了監(jiān)管創(chuàng)新、基礎(chǔ)設(shè)施發(fā)展、稅收政策以及與全球科技巨頭的合作…
2025-06-19 -
2025年韓元炒幣僅次于美元!韓國崛起為全球第二大加密貨幣市場
2025年,韓國的加密貨幣市場從散戶到政壇都在關(guān)注一件事:何時能正式推出合法的加密貨幣ETF?本文將深入分析韓國的市場動態(tài)、政治動向與監(jiān)管現(xiàn)況,揭示這場金融革命的最新…
2025-06-19 -
加密生態(tài)系統(tǒng)的弱點: 越南全面封禁Telegram
越南封禁Telegram致加密社區(qū)活躍度驟降45%,暴露行業(yè)對單一平臺的依賴,暴露了加密生態(tài)系統(tǒng)的弱點,行業(yè)需推動平臺多元化以應(yīng)對風(fēng)險,詳細(xì)請看正文介紹…
2025-06-19 -
梳理中美歐穩(wěn)定幣監(jiān)管法案:各國涉足穩(wěn)定幣領(lǐng)域的公司有哪些?
2025年穩(wěn)定幣成最熱賽道,中美歐加速監(jiān)管與布局,香港通過法案推動合規(guī),美國GENIUS法案規(guī)范市場,歐洲MiCA統(tǒng)一監(jiān)管,接下來為大家詳細(xì)解讀各法案以及各國都有哪些巨頭參與穩(wěn)定…
2025-06-19 -
GENIUS法案獲美參議院通過 到底加密行業(yè)有哪些影響
美國參議院通過《GENIUS法案》,首次建立穩(wěn)定幣聯(lián)邦監(jiān)管框架,要求1:1抵押并禁止收益,那么改法案的通過到底對加密行業(yè)有哪些影響呢?有可能削弱Tether的地位嗎?今天為大家全…
2025-06-19 -
以太坊收益分析:ETH 的未來如何?
隨著收益型穩(wěn)定幣和 DeFi 協(xié)議的出現(xiàn),以太坊質(zhì)押收益因總量增長而下降,以太坊質(zhì)押收益率正在下降,ETH 能否在這場收益率之戰(zhàn)中重新占據(jù)上風(fēng)?接下來小編為大家詳細(xì)說說…
2025-06-19 -
川普造手機:爭議、現(xiàn)實與流量變現(xiàn)政治經(jīng)濟學(xué)
2025 年 6 月 16 日,美國總統(tǒng)特朗 普正式宣布推出旗下移動通信品牌 Trump Mobile,并同步公布其首款智能手機 T1 及配套的「The 47 Plan」通信套餐,特朗 普在發(fā)布中高調(diào)宣…
2025-06-19 -
香港穩(wěn)定幣牌照如何申請?難不難?香港穩(wěn)定幣牌照申請全攻略
穩(wěn)定幣,作為連接傳統(tǒng)金融與加密世界的橋梁,其重要性不言而喻,然而,本文將結(jié)合最新的《條例》、《監(jiān)管指引》和《AML咨詢文件》,為潛在申請人提供一份詳盡的香港穩(wěn)定幣牌…
2025-06-19 -
挪威加密公司K33籌集約890萬美元資金用以購買最高1000枚比特幣
挪威加密經(jīng)紀(jì)公司K33正在通過股票發(fā)行籌集至少8500萬瑞典克朗(約890萬美元),用于其購買最高1000枚比特幣(BTC)作為其資金儲備的計劃…
2025-06-19