探討繁中大型語言模型建構之挑戰與克服

, 聯發科技
, 聯發創新基地

聯發創新基地打造突破性 Breeze-7B 和 BreeXe-8x7B,為繁體中文界提供專有的語言模型。Breeze-7B 是一個具有 70 億參數的開源模型,而 BreeXe-8x7B 則更是一個具有 420 億參數的模型。在它們各自的參數數量上,這兩個模型,目前被公認為最優秀的繁體中文開源模型。藉此可供企業打造任何繁體中文及英文的應用,如客戶服務、文件分析、管理助理等。本演講議程,我們將分享訓練這些模型的過程中所遇到的挑戰和所獲得的經驗,例如長上下文預訓練和指令微調。可以此模型為基礎開發適用於各產業的應用。

活动: AI Summit Taiwan
日期: June 2024
行业: 所有行业
级别: 通用
话题: Natural Language Processing (NLP)
语言: Simplified Chinese, Traditional Chinese
所在地: