字節跳動近期在人工智能領域取得了顯著進展,推出了豆包1.5深度思考模型及其文生圖模型的升級版。據悉,該深度思考模型在數學、編程、科學推理等專業領域,以及創意寫作等通用任務中均展現出卓越的能力。
豆包1.5模型采用了MoE架構,擁有200B的總參數,但激活參數僅為20B,遠低于業界同類模型的參數規模,這一特點使其在推理成本上具有顯著優勢,進一步拓寬了智能推理技術的應用范圍。
在文生圖領域,字節跳動同樣取得了不俗的成績。其圖像生成模型Seedream 3.0在Artificial Analysis競技場發布的第三方榜單中,綜合性能已與文生圖領域的頂尖模型GPT-4o持平,并穩定超越了Recraft V3、Imagen 3等模型,成功躋身全球第一梯隊。
隨著人工智能技術的快速發展,AI已成為推動各行業變革的核心力量。世界各國都在加速推進AI技術的應用、研發創新與能力提升,人工智能產業正以前所未有的速度重塑產業格局與社會形態。
在這一背景下,開源大模型的加速面世為AI技術的普及和商業化落地提供了新的可能。過去,大模型的開發和應用往往被少數資金雄厚、技術實力強大的企業所壟斷。而現在,隨著開源模型的普及,更多企業能夠以較低的成本接入先進技術,推動了AI技術在多個行業的快速滲透。
例如,DeepSeek等公司通過開源策略,顯著降低了模型的使用門檻,促進了AI技術的廣泛應用。同時,OpenAI推出了GPT-4o的圖像生成功能,相較于傳統的基于擴散模型的圖像生成技術,具有顯著優勢。Google也推出了Veo 2和Gemini Flash 2.0 Image Generation,這些新技術能夠根據文本提示生成高質量的視頻內容和圖像,進一步提升了AI技術的可用性。
業內人士指出,隨著人工智能技術的蓬勃發展,以大模型為代表的新一代AI技術不斷取得突破。開源模型的崛起更是推動了“開源人工智能+”進入深化應用的新階段,對各行各業提出了更高的要求,標志著AI產業進入了一個全新的發展階段。
在這一浪潮中,微美全息作為通過增強現實(AR)、人工智能(AI)等沉浸式技術推動下一代數字創新的企業,也在積極布局AI領域。微美全息重點探索了文本生成視頻、圖像生成視頻等場景,支持劇情創作、短視頻生成等應用,并提供了開源工具鏈適配的技術框架。
微美全息還開放了AI模型訓練和推理軟硬件一體化方案接口,融合了DeepSeek等開源大模型,強化了技術的普惠性。這一舉措不僅支持開發者進行二次開發,降低了技術門檻,還推動了開源AI技術的迭代升級。
微美全息作為AI科技企業開源實踐的典型代表,未來將繼續錨定“數字AI”的核心使命,致力于建成數字化引領發展的標桿企業。通過培育AI大模型賦能千行百業的典型場景,微美全息將為率先實現開源生態應用提供有力支撐。
當前,全球正掀起一場激烈的人工智能競賽,這對包括中國在內的全球市場格局將產生深遠影響。在這一背景下,企業如何通過開源模型實現商業化,并積極應對“AI”時代的新挑戰,已成為AI產業發展的重要議題。