從基礎設施到產品應用,智源對Scaling Law、基礎模型、具身智能、超級應用、AI安全等關鍵方向作出預測。 智源研究院院長王仲遠表示,當前,我們處在人工智能發展的新拐點,大模型的能力涌現加速通用人工智能時…
多項評測結果中,字節跳動多項AI能力領先,阿里巴巴、百度等大廠派AI均取得優異表現。 在視覺語言多模態模型能力評測結果中,一些較好的開源模型在圖文理解任務上正在縮小與頭部閉源模型的能力差距,而長尾視覺知識與文…
在“多模態模型評測榜單”的視覺語言模型中,得分國內最高的豆包·視覺理解模型也在FORCE原動力大會上正式對外發布。通過更強的內容識別能力、更強的理解和推理能力、更細膩的視覺描述能力,豆包·視覺理解模型極大地…
媒體:從發布的評測結果來看,豆包模型在幾個榜單中的排名都比較靠前,是互聯網大廠的模型研發能力在大幅提升嗎?2025年,基于語言模型肯定會有更多AI Agent(智能體),能完成更復雜的任務,這是明年的熱點…
在評測方法與工具上,智源研究院聯合全國10余家高校和機構合作共建,探索基于AI的輔助評測模型FlagJudge和靈活全面的多模態評測框架FlagEvalMM,并構建面向大模型新能力的有挑戰的評測集,包括與北…
2024年12月19日,智源研究院發布并解讀國內外100余個開源和商業閉源的語言、視覺語言、文生圖、文生視頻、語音語言大模型綜合及專項評測結果。 智源評測發現,2024年下半年大模型發展更聚焦綜合能力提升與實…
水木清華校友種子基金管理合伙人王學輝表示:“智源深瀾的團隊在大分子進化和設計領域選擇了以功能為主要對象而非基于蛋白結構的技術路線,體現了團隊對AI賦能大分子設計的獨特理解,團隊已在多個項目中展現了AI在蛋白…
10 月 29 日消息,北京智源人工智能研究院(BAAI)推出了新的擴散模型架構OmniGen,這是一種用于統一圖像生成的多模態模型。 ▲ 文本生成圖像,編輯生成圖像的部分元素,根據生成圖像的人體…
智源研究院院長王仲遠向鈦媒體App等表示,Emu3證明了下一個token預測能在多模態任務中有高性能的表現,這為構建多模態AGI提供了廣闊的技術前景。智源探索出了Emu3這樣一條技術路線,那么接下來需要展示…
智源研究院最新發布原生多模態世界模型 Emu3,該模型在文本、圖像、視頻理解與生成方面取得了突破性進展。此外,Emu3還提供了強大的視覺tokenizer功能,能夠將視頻和圖像轉換為離散token,并且這些…
據介紹,Emu3 提供了一個強大的視覺 tokenizer,能夠將視頻和圖像轉換為離散 token。 Emu3 研究結果證明,下一個token 預測可以作為多模態模型的一個強大范式,實現超越語言本身的大規…
作為領先頭部AI公司,百度自2010年起開始全面布局人工智能,是全球為數不多、進行全棧布局的人工智能公司,從昆侖芯、飛槳深度學習平臺、文心大模型到應用,在技術棧各層都有關鍵自研技術。 智源研究院作為人工智能領…
在這個 Berkerly UR5 Demonstration Dataset 場景中,即使是 GPT-4o 或人類,都無法從單張 RGB圖像中判斷機械爪是否碰到了目標物體,比如借助深度信息,將深度圖直接給 …
獲悉,此前,小米集團和機器人泰斗王田苗,投了一家具身智能科技公司「小雨智造」。 據了解,「小雨智造」的核心創始團隊也曾是小米曾經的高層:「小雨智造」創始人喬忠良是小米的初創成員之一,曾經是MIUI研發…
王仲遠告訴 AI 科技評論,智源在做的事是解決這一痛點,當某家廠商需要訓練萬億乃至更大規模參數模型的時候,無需從頭去解決收斂等一系列問題,開源社區中有一個好的初始化的版本,這時再基于更強的算力和數據量即可對模…
6月中旬,智源研究院旗下的 FlagEval 大模型評測平臺發布最新榜單:在有標準答案的“客觀評測”中,GPT-4 以76.11分在閉源大模型
11/24 16:08
11/24 16:07
10/31 16:58
10/31 16:56