国产网址在线观看,丁香六月久久,亚洲av无码专区首页,免费精品一区二区三区第35

首頁 生活頻道 熱點(diǎn)資訊

商湯科技「日日新 V6」發(fā)布,最強(qiáng)多模態(tài)推理融入“百姓之日用”

2025-04-21 15:42 來源:互聯(lián)網(wǎng)

深度思考與多模態(tài)緊密結(jié)合,國產(chǎn)大模型率先拓寬AI能力邊界。

4月10日,商湯科技在上海、深圳等地同步發(fā)布「日日新SenseNovaV6」大模型體系,通過多模態(tài)長思維鏈訓(xùn)練、全局記憶、強(qiáng)化學(xué)習(xí)的技術(shù)突破,形成領(lǐng)先的多模態(tài)推理能力,并突破成本邊界。

1

「日日新V6」主要提升如下:

模型能力顯著提升:在長思維鏈、推理、數(shù)理、全局記憶方面擁有顯著優(yōu)勢,多模態(tài)推理能力國內(nèi)第一,對標(biāo)GPT-o1,數(shù)據(jù)分析能力大幅領(lǐng)先GPT-4o;

高效能與低成本完美結(jié)合:多模態(tài)訓(xùn)練整體效率對齊語言訓(xùn)練實(shí)現(xiàn)業(yè)內(nèi)最優(yōu)水平,推理成本亦實(shí)現(xiàn)業(yè)界最低;

輕量級的全模態(tài)交互模型升級:SenseNovaV6Omni擁有國內(nèi)最強(qiáng)的多模態(tài)交互能力;

國內(nèi)首個(gè)支持10分鐘中長視頻深度解析的大模型,對標(biāo)Gemini2.5Turbo達(dá)到同類型最強(qiáng)。

商湯科技董事長兼首席執(zhí)行官徐立表示:“AI之道,在于百姓之日用。商湯日日新V6將跨越多模態(tài)邊界,釋放推理與智能的無限可能。”

2

如今,憑借單一模型就可以完成文本、多模態(tài)等各類任務(wù)。

來看看BenchMark的成績:

【核心指標(biāo)】純文本任務(wù)綜合性能優(yōu)秀,比肩國際一線模型;多模態(tài)性能領(lǐng)先,各方面性能突出;純文本推理與多模態(tài)推理能力均對標(biāo)GPT-4.5和Gemini2.0Pro等國際一流模型的水平。

3

【強(qiáng)推理能力】日日新融合模型從5.5到V6/V6Reasoner,推理能力顯著提升,多模態(tài)和語言深度推理任務(wù)上同時(shí)超過了OpenAI的o1和Gemini2.0flash-thinking的水平。

4

而具體表現(xiàn)如何?圍繞日常生產(chǎn)生活高頻出現(xiàn)的需求場景,我們分別從三個(gè)能力來呈現(xiàn)一下AI如何融入百姓之日用。

多模態(tài)推理能力

真實(shí)環(huán)境存在的復(fù)雜問題則更考驗(yàn)大模型對于混合圖文的理解推理能力。

「日日新V6」存在很強(qiáng)的擴(kuò)展性,能夠快速適配新業(yè)務(wù)場景,無需重新設(shè)計(jì)規(guī)則或調(diào)整流程。

例如保險(xiǎn)理賠,下面這是商業(yè)醫(yī)療保險(xiǎn)理賠材料,我們請「日日新V6」判斷提供材料是否符合理賠要求。傳統(tǒng)方案通常高度依賴事先設(shè)定的規(guī)則,根據(jù)規(guī)則定向去找文檔里面的關(guān)鍵信息,比如總金額、治療開藥日期?!溉杖招耉6」通過多模態(tài)數(shù)據(jù)的深度整合與強(qiáng)推理能力,能夠更全面地捕捉全部文檔的全量信息,以開放式的方式來推理并結(jié)合場景做深度。

5

「日日新V6」比對處方金額與發(fā)票金額,判斷處方單及發(fā)票藥品明細(xì),提取出中西醫(yī)結(jié)合診療情況下西藥處方單的缺失(因?yàn)榘l(fā)票中開具的地屈孕酮片屬于處方藥,必須有主治醫(yī)生開具處方單佐證);更深度的理解是模型通過處方簽的初步診斷“輕度貧血”自動匹配提供的理賠材料中是否有血液檢查單,用于支撐診斷;能自動解析醫(yī)療票價(jià)中的隱匿關(guān)聯(lián),識別過度醫(yī)療的潛在風(fēng)險(xiǎn)。

現(xiàn)實(shí)生活中小額理賠的材料審核往往需要3-7天的時(shí)間,而交給AI只需要1分鐘,還通過長思維鏈能力,自我梳理好材料邏輯沖突的地方。

基于超過200B高質(zhì)量多模態(tài)長思維鏈數(shù)據(jù),商湯通過多智能體協(xié)作進(jìn)行長思維鏈合成和驗(yàn)證,「日日新V6」形成了突出的多模態(tài)推理能力,可以支持合成最長64K的多模態(tài)長思維鏈,支持模型長時(shí)間思考能力。同時(shí),商湯也實(shí)現(xiàn)多模態(tài)強(qiáng)化學(xué)習(xí)技術(shù)突破,構(gòu)建了面向多種圖文任務(wù)的混合增強(qiáng)學(xué)習(xí)框架,基于不同難度分級和多獎勵模型的強(qiáng)化學(xué)習(xí)訓(xùn)練。

▎多模態(tài)視頻解析能力

憑借“全局記憶”能力,「日日新V6」打破了傳統(tǒng)模型僅支持短視頻的限制,可支持10分鐘級視頻全幀率解析。

多維信息壓縮是實(shí)現(xiàn)這一突破的重要技術(shù),商湯自研技術(shù)可將視覺信息(畫面)、聽覺信息(語音、音效)、語言信息(字幕、口語)、時(shí)間軸邏輯進(jìn)行對齊,形成多模態(tài)統(tǒng)一時(shí)序表征。

在此基礎(chǔ)上通過細(xì)粒度級聯(lián)信息壓縮和內(nèi)容敏感的動態(tài)過濾,實(shí)現(xiàn)長視頻的高比例壓縮,10分鐘視頻可以壓縮到16Ktokens,仍然保留關(guān)鍵語義。

實(shí)時(shí)音視頻交互能力

伴隨日日新SenseNovaV6的發(fā)布,商湯日日新實(shí)時(shí)交互融合大模型升級至「SenseNovaV6Omni」,在角色扮演、翻譯點(diǎn)讀、文旅導(dǎo)游、講解繪本、數(shù)學(xué)講解等場景下進(jìn)行了深度優(yōu)化。以講解繪本場景為例,下圖為本次素材,看看「SenseNovaV6Omni」是如何發(fā)揮的:

6

「SenseNovaV6Omni」更像人的感知和表達(dá)能力、情感理解能力,并已在具身智能等領(lǐng)域?qū)崿F(xiàn)多行業(yè)、多場景落地,成為國內(nèi)首個(gè)商業(yè)化的全模態(tài)實(shí)時(shí)交互模型。

Onemorething.

滿血·All-in-one·商量APP來了!

用戶通過一個(gè)入口,即可體驗(yàn)文字、圖像、視頻等多種模態(tài)流式交互體驗(yàn),商量APP已啟動內(nèi)測。

目前「日日新V6」的能力可在商量Web端體驗(yàn)。復(fù)雜繁瑣的文檔處理場景遇上多模態(tài)強(qiáng)推理AI,效率提升翻倍,也可來基于「日日新V6」的商湯辦公小浣熊體驗(yàn)。

【廣告】 (免責(zé)聲明:本文為本網(wǎng)站出于傳播商業(yè)信息之目的進(jìn)行轉(zhuǎn)載發(fā)布,不代表本網(wǎng)站的觀點(diǎn)及立場。本文所涉文、圖、音視頻等資料的一切權(quán)利和法律責(zé)任歸材料提供方所有和承擔(dān)。本網(wǎng)站對此資訊文字、圖片等所有信息的真實(shí)性不作任何保證或承諾,亦不構(gòu)成任何購買、投資等建議,據(jù)此操作者風(fēng)險(xiǎn)自擔(dān)。) 本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人,如有侵權(quán),請聯(lián)系本網(wǎng)進(jìn)行刪除。

責(zé)任編輯:謝夢航

返回首頁
相關(guān)新聞
返回頂部