為順利啟動卑南語四方言(南王、知本、西群初鹿、建和)語料庫建置,團隊與臺東縣卑南族民族自治事務促進發展協會在114年7月21日於臺東舉辦一場「卑南族四方言語料蒐錄合作座談會」,邀請多位耆老、語言專家及族人,共同討論如何攜手合作卑南語語料蒐錄保存與後續的推廣服務。由於當天遇到薇帕颱風侵台前的豪雨導致交通不便,有多位原訂出席的耆老與專家無法參與,團隊後續加辦兩場「卑南語協作平台操作說明會」,讓未參與座談會的耆老專家也能了解計畫目標與熟悉協作平台的操作。
座談會中,計畫團隊首先簡報近兩年的成果,包括太魯閣語、鄒語的大規模語料蒐錄與AI模型建置,團隊強調語料庫不僅是單純的錄音檔案,更是保存耆老最標準、最自然發音的文化資產,並已成功應用於族語語音辨識、語音合成及族語—華語雙向翻譯等AI模型,同時提供模型推論API服務,讓高師大團隊開發族語識字能力自學平台,讓青年能以更多元、有趣的方式學習族語。
在座談會的交流過程中,卑南語專家特別提醒,卑南語四個方言各具獨特語音與詞彙特色,若未妥善保存,極易隨耆老凋零而流失。為此,雙方達成共識,邀請各方言的耆老與族語老師加入團隊,協助先進行語料文字修訂,團隊再將驗證過的語料上架到卑南語四方言協助平台,透過協作平台讓耆老專家可在家進行線上錄音,讓卑南語的語料能快速大量累積,並建立成完整的數位語料庫。耆老們在會中表示,能透過科技留下自己的聲音,傳承給子孫,十分有意義,更期待透過這個平台,不但能讓族語永續保存下來,亦能應用於學校教材、族語課程與文化推廣。協作平台截至8月30日已完成四方言合計超過一萬句語音錄製,成功邁出卑南語語料庫建置的重要第一步。



