一個AI驅(qū)動百萬個API!微軟提出多任務(wù)處理模型TaskMatrix
蕭簫 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI通往AGI的路究竟怎么走,微軟有了新想法——
基于ChatGPT這類大模型的強大理解能力,將輸入的任何信號拆解成一個個可完成的任務(wù),交給其他的AI和程序完成。
簡單來說,就像是建了一座司令塔,每個大模型都能成為其中的“大腦”指揮官,其他專門解決某類任務(wù)的模型,則聽它調(diào)令——
這樣一來,不限定某個AI,所有大模型都能使用這套方法。
能解決什么問題?
人類只需要提需求,AI從自動做PPT、Word和Excel三件套(Office自動化),到驅(qū)動機器人完成各種智能任務(wù),都能搞定。
這個最新的研究名叫TaskMatrix,據(jù)微軟表示,它能直接驅(qū)動數(shù)百萬個用于完成任務(wù)的AI和API。

論文還引用了OpenAI CEO奧特曼那句AI版摩爾定律:
宇宙中的智能數(shù)量每18個月翻一番。
一起來看看TaskMatrix是怎樣工作的。
AI“司令塔”如何工作?
這是TaskMatrix的整體工作流程:

從架構(gòu)圖來看,TaskMatrix可以被分為四部分:
- 多模態(tài)對話基礎(chǔ)模型(MCFM):與用戶對話并了解需求,從而生成API可執(zhí)行代碼以完成特定任務(wù)
- API平臺:提供統(tǒng)一API格式,存儲數(shù)百萬個不同功能的API,允許擴展和刪除API
- API選擇器:負責根據(jù)MCFM生成的內(nèi)容推薦API
- API執(zhí)行器:調(diào)用API并執(zhí)行生成代碼,給出結(jié)果
簡單來說,MCFM負責生成解決方案,API選擇器從API平臺中選取API,隨后API執(zhí)行器基于MCFM生成的代碼調(diào)用API,并解決任務(wù)。
其中,為了統(tǒng)一API管理,API平臺又給API統(tǒng)一了文檔格式,包含以下五個部分:
API名稱(提供API摘要,避免與其他API混淆),參數(shù)列表(包含輸入?yún)?shù)和返回值等),API描述(功能描述),組合指令(如何組合多個API完成復(fù)雜用戶指令)
例如這是“打開本地文件”API的文檔格式:

據(jù)微軟介紹,搭建TaskMatrix的原因,從學(xué)術(shù)角度來說主要有兩點。
其一,擴大AI適用范圍,如通過擴展API來提升可完成任務(wù)的類型和數(shù)量;其二,便于進一步提升AI可解釋性,通過觀察AI分配任務(wù)的方式就能理解它的“思路”。
能完成什么任務(wù)了?
目前從已經(jīng)搭建好的TaskMatrix部分來看,它能完成的任務(wù)已經(jīng)非常廣泛。
小到文字、圖像信息的基礎(chǔ)信息處理,大到控制機器人平臺、接入物聯(lián)網(wǎng)這種通用平臺任務(wù),TaskMatrix都能搞定。
先來看看圖像處理任務(wù)。
TaskMatrix解讀用戶想要完成的任務(wù)后,就能通過對話的方式,搞定PS(把老人背景P成白的)、解讀圖像、文生圖、草圖轉(zhuǎn)真實圖像、摳圖等一系列現(xiàn)實生活中常見的圖像處理操作:

如果說這些都還太常見,基于TextMatrix還能搞定真·圖像擴展,基于一小角擴展到一整張圖的那種,而不僅僅是采用平鋪的方式。例如輸入一朵花:

輸出一片花田:

再來看看文字處理任務(wù)。
以往需要手動改AI寫過的方案,如今直接將問題拋給AI,它就能完成,例如具體修改某個特定的步驟。

(像不像被甲方一點點催改文件的樣子?只是如今你變成了甲方)
以后生成文章,就是連插圖都配好的那種:

當然,既然是微軟的研究,少不了調(diào)用Office系列的API,包括做PPT這種活,如今交給AI來做就行:

再進一步到通用任務(wù)上,之前一直存在瓶頸的機器人和物聯(lián)網(wǎng)等平臺,如今TaskMatrix也給出了解決通用任務(wù)的方案。
家里接入AI后,和它對話就能完成你想要的各種瑣碎任務(wù),包括定鬧鐘、查看天氣等:

屬實是解放人類生產(chǎn)力了。
你想好把它用在哪里了嗎?
論文地址:
https://arxiv.org/abs/2303.16434— 完 —
量子位 QbitAI · 頭條號簽約
隨便看看:
- [業(yè)內(nèi)]大爆炸后天體運行速度僅為現(xiàn)在的五分之一
- [業(yè)內(nèi)]中國空間天氣預(yù)報準確率達國際先進水平
- [業(yè)內(nèi)]零門檻復(fù)現(xiàn)ChatGPT:預(yù)訓(xùn)練模型數(shù)據(jù)集直接用,包含完整R
- [科技]推特企業(yè)“金 V”認證免費時代即將結(jié)束,費用太高惹客戶不滿
- [業(yè)內(nèi)]寬動態(tài)是什么意思,需具不小于105db寬動態(tài)什么意思
- [業(yè)內(nèi)]日本團隊研發(fā)出高導(dǎo)電性的固態(tài)電解質(zhì)
- [業(yè)內(nèi)]首位轉(zhuǎn)基因豬心移植患者心衰原因公布
- [科技]百度:嚴禁任何形式的文心一言測試賬號轉(zhuǎn)讓、販賣等行為,已展開
- [業(yè)內(nèi)]清華大學(xué)-北京京東世紀貿(mào)易有限公司智慧零售技術(shù)聯(lián)合研究中心成
- [業(yè)內(nèi)]麒麟軟件致力打造世界級操作系統(tǒng)中國品牌
相關(guān)推薦:
網(wǎng)友評論:
推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件
- 力德動力30kw微渦發(fā)電機成功完成高原考核
- 突破溫度與凈化邊界,美的空氣機打造舒適生活空間
- 原創(chuàng)科技守味二十四節(jié)氣!卡薩帝冰箱濟南啟動非遺守護
- 最新盤點!中國超聲波焊接機TOP10,首位靈科,其
- 科技與美學(xué)的突破:伯恩光學(xué)聯(lián)合三星重塑智能手機形態(tài)
- 阿爾西溫控技術(shù)自主破局!國產(chǎn)創(chuàng)新撕破海外壟斷壁壘,
- 樂創(chuàng)技術(shù)五軸點膠+視覺補償:破解AR/VR光學(xué)模塊
- 臺易探針
- 卓興半導(dǎo)體芯上印刷工藝:封裝新突破,攻克點膠印刷難
- 科技賦能民生福祉 金天國際以創(chuàng)新實踐助力國家戰(zhàn)略落
- 熱點搶先看|2024南方網(wǎng)通第二十五屆渠道商交流會
- 《大數(shù)據(jù)平臺云化改造實踐指南(2024)》發(fā)布,天
- 覺卿諦語智能科技在全國12355心理健康大會上展示
- 當好“兩個稀土基地”建設(shè)主力軍,北方嘉軒永磁電機大
- 大模型助力工業(yè)智能化發(fā)展
- 工商業(yè)光伏發(fā)電施工指南-太陽庫光伏
- 科技賦能,避震嬰兒車或成為行業(yè)硬通貨
- 龍旗科技進軍AI PC市場,激發(fā)行業(yè)創(chuàng)新活力
- 科技賦能教育:核桃編程亮相“科創(chuàng)中國·北京創(chuàng)新薈”
- 英偉達搶占高位,市場急需尋求新機遇,這三支AI股值