成人欧美一区二区三区1314,国产98在线 | 传媒麻豆,国产96在线

史上最強模型！GPT-4發(fā)布，太強大了！

http://m.007sbw.cn 2023-03-16 15:35 來源：網(wǎng)易新聞

　　OpenAI 聯(lián)合創(chuàng)始人 Sam Altman 表示，它是“迄今為止功能最強大、最一致的模型”，能夠使用圖像和文本。

　　當?shù)貢r間3月14日，人工智能研究公司OpenAI公布了其大型語言模型的最新版本——GPT-4。

　　“我們花了 6 個月的時間，利用對抗性測試項目以及 ChatGPT 的經驗，反復調整 GPT-4，結果在真實性、可操作性以及拒絕超出道德等邊界方面取得了有史以來最好的結果（盡管遠非完美）”，OpenAI 分享道。

　　在GPT-4發(fā)布后，微軟宣布自家產品早已第一時間用上了 GPT-4。"我們很高興地確認，新的 Bing 正在 GPT-4 上運行，為搜索而定制，"微軟在一篇博客文章中寫道。"如果你在過去六周的任何時候使用過預覽版的新 Bing，你已經提前看到了 OpenAI 的最新模型的力量。隨著 OpenAI 對 GPT-4 及以后的更新，Bing 從這些改進中受益，以確保我們的用戶擁有最全面的副駕駛功能。"

　　除了表現(xiàn)方面，還有一個明顯的不同是，ChatGPT-4比以前的版本“更大”，這意味著它已經接受了更多數(shù)據(jù)的訓練，因此運行起來也更加昂貴。這也意味使用它的成本越來越高。與ChatGPT不同的是，這個新模型目前還不能免費公開測試，雖然它鼓勵開發(fā)者申請試用，但是將需要上等待名單。

　　新模型將提供給ChatGPT的付費用戶 ChatGPT Plus（每月20美元），也將作為API的一部分提供，允許開發(fā)者付費將AI集成到他們的應用程序中。OpenAI表示，多家公司已經將GPT-4集成到他們的產品中，包Duolingo、Stripe和Khan Academy等。

　　GPT-4到底強在哪里？

　　GPT-4 比上一個版本強在哪？OpenAI 稱，雖然這兩個版本在隨意的談話中看起來很相似，但“當任務的復雜性達到足夠的閾值時，差異就會出現(xiàn)”，GPT-4 更可靠、更有創(chuàng)意，并且能夠處理更細微的指令。

　　多模態(tài)的引入，讓此次發(fā)布的GPT相較上一代綜合體感明顯“更上一層樓”。

　　“GPT-4比以往任何版本更具創(chuàng)造性和協(xié)作性”，并且“有更廣泛的常識和解決問題的能力，可以更準確地解決難題”。OpenAI的CEO Sam Altman說：“這是我們迄今為止功能最強大的模型。”

　　為讓眾人更加清楚地了解 GPT-4，OpenAI 官方不僅上線了介紹性的網(wǎng)頁（https://openai.com/research/gpt-4），還發(fā)布了一篇技術論文（https://cdn.openai.com/papers/gpt-4.pdf），詳細分享了 GPT-4 強大的功能。

　　值得注意的是，OpenAI 公開的技術報告中，不包含任何關于模型架構、硬件、算力等方面的更多信息。

　　從技術維度上來看，GPT-4 是一個基于 Transformer 的模型，經過預訓練，可以預測文檔中的下一個 token。這個項目的一個核心部分是開發(fā)了基礎設施和優(yōu)化方法。這使 OpenAI 能夠根據(jù)不超過 GPT-4 的 1/1000 的計算量訓練的模型，準確地預測 GPT-4 的某些方面的性能。

　　10秒鐘做出一個網(wǎng)站

　　在 GPT4 的發(fā)布會上，OpenAI 的總裁和聯(lián)合創(chuàng)始人 Greg Brockman 展示了 GPT-4 擁有的強大編程技能，有一段兩分鐘的精華，演示的內容如下：

　　1. 在草稿本上用紙筆畫出一個非常粗糙的草圖；

　　2. 拍照告訴 GPT-4 我們要做一個網(wǎng)站，效果就是圖中這樣，讓 GPT-4 生成網(wǎng)站代碼；

　　3. GPT-4 自己實現(xiàn)一個網(wǎng)站，總共歷時十秒鐘左右。

　　這效果給當下不少開發(fā)者帶來了壓力以及非常強烈的職業(yè)危機感，有人當即表示“睡不著了”：“輾轉反側了一個晚上，思考未來 5-10 年我們到底會在哪里。”

　　考試能力超過90%人類

　　在分析 GPT-4 的能力時，OpenAI 還讓該模型參加了統(tǒng)一律師考試、法學院入學考試（LSAT）、研究生入學考試（GRE）的定量、口頭推理、分析寫作考試以及和各種 AP 科目考試等測試。

　　據(jù)了解，GPT-4在各種專業(yè)學術基準上有著人類水平表現(xiàn)。例如在模擬律師考試中，GPT-4得分約為前10%——擊敗了90%人類，而ChatGPT背后的GPT-3.5得分約為倒數(shù)10%。

　　GPT-4 在大多數(shù)這些專業(yè)和學術考試中表現(xiàn)與人類水平相當。這意味著，如果 GPT-4 是一個僅憑應試能力來判斷的人，它可以進入法學院，而且很可能也能進入許多大學。

　　玩圖也一流

　　GPT-4可以接收文本和圖像輸入，用戶可指定任何視覺或語言任務。具體來說，它可以生成文本輸出（自然語言、代碼等），給定的輸入包括穿插的文本和圖像。在一系列的領域中，包括帶有文字和照片的文件、圖表或屏幕截圖，GPT-4表現(xiàn)出與純文本輸入類似的能力。

　　GPT-4可以看懂搞笑圖中的梗！

　　用戶：這幅圖有什么不尋常之處？

　　GPT-4：這張的不尋常之處在于，一名男子正在連接在一輛行駛中的出租車車頂?shù)撵僖掳迳响贍C衣服。

　　用戶：你能解釋一下這個帖子嗎？

　　GPT-4：這個備忘錄是一個笑話，它結合了兩個不相關的東西：從太空看地球的和雞塊。該備忘錄的文字表明，下面的是從太空拍攝的地球的照片。然而，該實際上是雞塊的排列，擺放得像一張世界地圖。這個備忘錄的幽默感來自于文字和的意外并置。文字讓人期待地球的雄偉形象，但圖像實際上是平凡而愚蠢的東西。

　　用戶：這幅畫有什么有趣的地方？逐一描述一下。

　　GPT-4：顯示的是一個“Lightning Cable”適配器的包裝，有三張圖。圖1：一部智能手機，其充電端口插著一個VGA接口。圖2：“Lightning Cable”適配器的包裝上有一張VGA接口的。圖3：VGA連接器的特寫，末端是一個小的Lightning連接器（用于為iPhone和其他蘋果設備充電）。這張的幽默感來自于將一個大的、過時的VGA連接器插入一個小的、現(xiàn)代的智能手機充電端口的荒謬性。

　　支持更長的輸入和輸出

　　在性能上，GPT-4 超越了過往的模型，它可以遵循自然語言的復雜指令、生成技術或創(chuàng)意作品，支持生成和處理多達 32,768 個 token（約 25,000 字的文本），這使得 GPT-4 能有更長的上下文，允許長篇內容創(chuàng)建、擴展對話以及文檔搜索和分析等用例。

　　超越傳統(tǒng)的大模型

　　在一套傳統(tǒng)的 NLP 基準測試中，GPT-4 超過了以前的大型語言模型和大多數(shù)最先進的系統(tǒng)（這些系統(tǒng)通常有特定的基準訓練或手工工程）。

　　在 MMLU（多任務語言理解）基準測試中，GPT-4 不僅在英語中以相當大的優(yōu)勢勝過現(xiàn)有的模型，而且在其他語言中也表現(xiàn)出強大的性能。在 MMLU 的翻譯變體上，GPT-4 的性能優(yōu)于 GPT-3.5 和其他 LLM（Chinchilla，PaLM）的英語性能，包括低資源語言，如拉脫維亞語、威爾士語和斯瓦希里語。

　　生成代碼、改 Bug 的最佳小能手

　　除此之外，OpenAI通過開源評估框架，用于自動評估AI模型性能的框架，允許任何人報告模型中的缺點，以幫助指導進一步改進。

　　與此同時，GPT-4 對代碼有超強的理解能力，可以幫助程序員生成代碼，遇上 Bug 時，甚至只要你把錯誤信息或者代碼異常的截圖發(fā)給 GPT-4，它就能幫你給出相應的提示。

　　GPT-4的局限性

　　盡管功能已經非常強大，但 GPT-4 仍與早期的 GPT 模型具有相似的局限性，其中最重要的一點是它仍然不完全可靠。OpenAI 表示，GPT-4 仍然會產生幻覺、生成錯誤答案，并出現(xiàn)推理錯誤。

　　1、該模型在其輸出中可能會有各種偏見，但OpenAI在這些方面已經取得了進展，目標是使建立的人工智能系統(tǒng)具有合理的默認行為，以反映廣泛的用戶價值觀。

　　2、GPT-4 通常缺乏對其絕大部分數(shù)據(jù)截止后（2021 年 9 月）發(fā)生的事件的了解，也不會從其經驗中學習。它有時會犯一些簡單的推理錯誤，這似乎與這么多領域的能力不相符，或者過于輕信用戶的明顯虛假陳述。有時它也會像人類一樣在困難的問題上失敗，比如在它生成的代碼中引入安全漏洞。

　　3、GPT-4 預測時也可能出錯但很自信，意識到可能出錯時也不會再檢查一遍（double-check）。有趣的是，基礎預訓練模型經過高度校準（其對答案的預測置信度通常與正確概率相匹配）。然而，通過OpenAI目前訓練后的過程，校準減少了。

　　OpenAI表示，研究團隊一直在對GPT-4進行迭代，使其從訓練開始就更加安全和一致，所做的努力包括預訓練數(shù)據(jù)的選擇和過濾、評估和專家參與、模型安全改進以及監(jiān)測和執(zhí)行。數(shù)據(jù)顯示，與GPT-3.5相比，模型對不允許內容的請求的響應傾向降低了82%，而GPT-4對敏感請求（如醫(yī)療建議和自我傷害）的響應符合政策的頻率提高了29%。

　　另外，OpenAI團隊還聘請了 50 多位來自人工智能對齊風險、網(wǎng)絡安全、生物風險、信任和安全以及國際安全等領域的專家，對該模型在高風險領域的行為進行對抗性測試，從而為改進GPT模型提供了依據(jù)。

　　“隨著我們繼續(xù)專注于可靠的擴展，我們的目標是完善我們的方法，以幫助我們越來越多地提前預測和準備未來的能力——我們認為這對安全至關重要。”OpenAI 表示。

　　生成式AI向超級AI快速演變

　　此前，有機構認為，GPT-4的發(fā)布有望成為生成式AI向超級AI快速演變的關鍵節(jié)點。

　　國盛證券指出，傳統(tǒng)模式下，視覺AI公司傾向于采用單點方式，在各個碎片場景中做客制化落地，定制化程度相對較高；若轉向大模型模式，GPT-4 的多模態(tài)能力有望帶來通用化的模式，顯著提升AI模型生產效率。

　　華鑫證券認為，微軟有望在產業(yè)中通過GPT-4不斷拓展下游新興領域，應用于更多的場景中，并利用其多模態(tài)模型成本改變傳統(tǒng) AI 客制化與定制化的特點，逐步向通用化方向發(fā)展。

　　值得注意的是，隨著GPT-4轉向多模態(tài)，未來輸入輸出出現(xiàn)圖像、視頻等形態(tài)，AI有望打開下游千行百業(yè)應用空間。

　　此外，更多機構將AIGC視為最先受益賽道。華鑫證券表示，文生圖賽道作為AIGC概念下商業(yè)模式較成熟的領域，有望率先實現(xiàn)向C端落地。

　　德邦證券方面也認為，GPT-4有望加速AIGC的應用普及，并且在視頻內容生成方面大放異彩，AIGC有望步入快速發(fā)展階段。

国产精品久久久久久久久软件,国产成人久久久精品二区三区,国产成人无码一区二区三区在线 ,大又大粗又爽又黄少妇毛片,国产精品成人aaaaa网站

史上最強模型！GPT-4發(fā)布，太強大了！

相關新聞

編輯精選

工控原創(chuàng)

国产精品久久久久久久久软件,国产成人久久久精品二区三区,国产成人无码一区二区三区在线 ,大又大粗又爽又黄少妇毛片,国产精品成人aaaaa网站

史上最強模型！GPT-4發(fā)布，太強大了！

相關新聞

編輯精選

工控原創(chuàng)

史上最強模型！GPT-4發(fā)布，太強大了！