亚洲欧美日韩精品,亚洲成aⅴ人片在线影院八,国产1024一区二区你懂的,欧美毛片一级的免费的

首頁 > 實(shí)用技巧 > 干貨教程 > OpenAI新功能太強(qiáng)大

OpenAI新功能太強(qiáng)大

發(fā)布時(shí)間:2024-12-07 20:26:14來源: 13041198719

OpenAI連續(xù)12天“王炸”的第二彈來了。不同于第一日聚焦人工智能(AI)模型,第二日的王炸專注于服務(wù)企業(yè)等組織的一款新功能,雖然看起來不太側(cè)重于普通消費(fèi)者,但據(jù)介紹它甚至可以讓簡易版推理模型o1 mini的效果超過本周四發(fā)布的正式版o1、所謂滿血o1。

美東時(shí)間12月6日周五,OpenAI在社交媒體X公布第二日活動(dòng)的主題是新功能“強(qiáng)化微調(diào)”(Reinforcement Fine-Tuning)。這個(gè)主題是指,企業(yè)組織將能夠通過“強(qiáng)化微調(diào)”微調(diào)o1 mini,滿足他們的特定需求。

OpenAI CEO Sam Altman在X發(fā)帖稱,強(qiáng)化微調(diào)的效果非常棒,是他今年最大的驚喜之一,期待看到大家利用這種功能的創(chuàng)造。

OpenAI的研究員本周五介紹,科學(xué)家、開發(fā)人員和研究人員可以根據(jù)自己的數(shù)據(jù)、而不是僅僅使用公開可用的數(shù)據(jù),量身定制OpenAI的強(qiáng)大推理模型o1。不同行業(yè)的人可以使用強(qiáng)化學(xué)習(xí)來創(chuàng)建基于 o1 的專家模型,從而提高該領(lǐng)域的整體專業(yè)知識水平。開發(fā)者、研究者和機(jī)器學(xué)習(xí)工程師將首次能運(yùn)用強(qiáng)化學(xué)習(xí),打造精通他們各自專業(yè)領(lǐng)域的專家模型。

OpenAI的研究員稱,強(qiáng)化微調(diào)并不是單單教模型模型輸出,它的運(yùn)作方式是,當(dāng)模型發(fā)現(xiàn)一個(gè)問題的時(shí)候,研究者給模型空間區(qū)仔細(xì)思考這個(gè)問題,然后評估模型給出的最終解答,運(yùn)用強(qiáng)化學(xué)習(xí),研究者可以強(qiáng)化產(chǎn)生正確答案的思路,抑制產(chǎn)生錯(cuò)誤答案的思路,只需要“幾十個(gè)例子”(a few dozen examples)、甚至12個(gè)例子,模型就能以有效的新方式學(xué)習(xí)特定領(lǐng)域的推理

通過強(qiáng)化學(xué)習(xí),用戶可以用大模型在特定數(shù)據(jù)上訓(xùn)練其他模型。這對于涉及到大量數(shù)據(jù)的復(fù)雜領(lǐng)域或需要專家領(lǐng)域知識的新研究非常有用。研究者舉例稱,最近和湯森路透合作,運(yùn)用強(qiáng)化微調(diào)微調(diào)o1 mini,讓它充當(dāng)法務(wù)助理,幫助他們的法律專業(yè)人士完成大部分分析工作流。

OpenAI稱,OpenAI的定制模型平臺將支持強(qiáng)化學(xué)習(xí),強(qiáng)化學(xué)習(xí)也是OpenAI內(nèi)部用于訓(xùn)練自家前沿模型的技術(shù),如GPT-4o和o1系列模型。在OpenAi的內(nèi)測中,強(qiáng)化微調(diào)已經(jīng)在生物化學(xué)、安全、法律和醫(yī)療保健領(lǐng)域取得成功。OpenAI計(jì)劃,2025年初讓強(qiáng)化微調(diào)面向公眾發(fā)布,目前已對企業(yè)、大學(xué)和研究院開放申請測試通道。

伯克利大學(xué)罕見遺傳病研究員 Justin Reese參與了OpenAI本周五對o1 mini模型的現(xiàn)場演示。演示中,研究者試圖從樣本數(shù)據(jù)池中獲取可能導(dǎo)致疾病的模型 ID 基因。

研究員展示了一個(gè)評估表,下圖可見,第一行是本周四OpenAI發(fā)布的正式版o1測評表現(xiàn),第二行是o1 mini的測評結(jié)果 ,第三行結(jié)果來自經(jīng)過最終強(qiáng)化微調(diào)的o1 mini。研究員進(jìn)行了三類評估,其中,top @1是測試模型給出的正確答案出現(xiàn)在列表最前列中的概率,top@5是正確答案出現(xiàn)在前五列的概率,top@max是答案出現(xiàn)在所有正確答案列表的概率。

如圖所示,正式版o1的測試通過率為25%,o1 mini為17%,而強(qiáng)化微調(diào)后的o1 mini竟然達(dá)到31%,超過了正式版o1,比正式版o1的測評結(jié)果高24%,而且相比未強(qiáng)化微調(diào)前,微調(diào)后的結(jié)果提高了82.3%。

干貨教程更多>>

一汽奧迪 Q6L e-tron 純電 SUV 明日預(yù)售:寧德時(shí)代 800V 電池 + 華為乾崑智駕 高階智能輔助駕駛為核心,小鵬MONA M03加推4款新版型 理想汽車:下一步或根據(jù)市場需求推出 MPV、轎車產(chǎn)品 理想汽車一季度營收259億元,連續(xù)十個(gè)季度保持盈利 養(yǎng)老規(guī)劃:時(shí)光穿梭中的現(xiàn)實(shí)與理想 極氪蔚來達(dá)成充電雙向互聯(lián)互通,Stellantis集團(tuán)確定新CEO 打造“全球一朵云”,廣汽邁入出海3.0時(shí)代 30.09 萬起詮釋安全哲學(xué)!沃爾沃全新 S90 以 98 年堅(jiān)守定義真豪華 為什么許多人到最后都選擇了一臺雷克薩斯? “靈魂三問”震動(dòng)商界:劉強(qiáng)東在杭州拋出了社會(huì)責(zé)任新命題 30.98萬起的魏牌全新高山,擊穿高端MPV市場防線 廣汽昊鉑HL銷量增速明顯,穩(wěn)居30萬級純電大六座SUV銷量TOP1 傳阿爾法?羅密歐可能推遲新款Stelvio SUV發(fā)布 安全是一種信仰 沃爾沃全新S90上市發(fā)布會(huì)詮釋豪華轎車安全新標(biāo)桿 有消息稱,國內(nèi)造車新勢力領(lǐng)軍企業(yè)理想汽車正籌劃布局家庭轎車市場 有智有趣,全能滿配,東風(fēng)納米06上市,限時(shí)先享價(jià)7.99萬元起 重新定義國民車標(biāo)準(zhǔn),東風(fēng)納米06憑實(shí)力說話! 8萬多就能買到技術(shù)智能SUV?緊湊型SUV市場新選擇長安UNI-Z 別克品牌迎來雙百萬甜蜜的回甘后調(diào)偏苦 2025美系車有多難?別克、福特、雪佛蘭等5品牌,僅1家月銷超萬輛 終端優(yōu)惠5萬左右 月銷超8千臺以上 本田皓影哪款配置值得入手? 比降價(jià)更真誠,一汽豐田如何出招? 比亞迪:落地匈牙利 歐洲市場占有率持續(xù)上升 湖北工業(yè)大學(xué)工程技術(shù)學(xué)院榮獲“2024年度吉利汽車校企合作青竹獎(jiǎng)” 寶馬新世代車型首發(fā)視平線全景顯示,4K級效果零分心交互 中國“官車”海外換新款?全新奧迪A6L竟然長這樣? 當(dāng)百年設(shè)計(jì)底蘊(yùn)邂逅智能時(shí)代:上汽奧迪A5L Sportback的進(jìn)化宣言 宏英智能:智能駕駛輔助系統(tǒng)已試裝于上汽 找零工APP五周年 領(lǐng)跑靈活用工賽道,服務(wù)超百萬藍(lán)領(lǐng)用戶 新勢力車企第一!理想汽車2025年第一季度營收259億元