如何透過整合文化背景來改進大型語言模型建模

, 國立台灣大學

本議程介紹專為台灣使用的繁體中文開發的開源大型語言模型,具有多種尺寸與架構,其中也包含了目前尺寸最大的混合專家式繁中模型。透過大量的台灣繁體中文資料集與訓練,開發出的模型不僅可理解與生成通順的繁體中文,還體現了台灣的文化背景知識與理解。新發布的語言模型在許多台灣的考試中達到了極優越的表現,甚至與未開源的專有模型效果相去不遠,期望新開源的模型可以帶動台灣產業與學術界在此領域的持續研究和發展。

活动: AI Summit Taiwan
日期: June 2024
行业: 所有行业
级别: 初级技术
话题: 生成式 AI 平台
语言: 繁体中文
所在地: