計算機科學學院成功上線“鑄牢中華民族共同體意識知識大模型” 積極推進人工智能有效賦能鑄牢工作
作者:張瀟 編輯:張瀟 上傳:祝夢歡 審核:柯尊韜 發布時間:2025-04-16 瀏覽次數:
隨著DeepSeek、ChatGPT、Sora等人工智能大語言模型技術的迅速發展,以馬克思主義民族觀、社會主義核心價值觀為指導有效運用和駕馭人工智能大語言模型,是當前和未來深入推進鑄牢中華民族共同體意識相關工作的大勢所趨。目前,在文化典籍數字化、歷史檔案智能化等垂直領域已開始構建人工智能技術生態,但在鑄牢中華民族共同體意識領域尚未形成專精化大模型。
我校計算機科學學院張瀟團隊敏銳捕捉新時代技術變革的趨勢,積極推進中華民族共同體學交叉學科建設,創新性地將人工智能技術與民族事務治理深度融合,成功上線“鑄牢中華民族共同體意識知識大模型”,探索出一條服務國家戰略需求、有效鑄牢中華民族共同體意識的新路徑。
張瀟團隊構建了民族工作領域首個大模型訓練自有語料庫。該語料庫以黨的民族理論政策、《中華民族共同體概論》教材、三交史等為養料(1324.4萬字),輔以涉民族領域法規數據庫、相關學術論文(4411.1萬字)。此外,從中央網站、民委網站、地方網站、黨校(行政學院)系統、社科院系統、國家高端智庫、全國重點馬克思主義學院等獲取約4000萬字語料以及1萬道問答對。形成了民族工作領域大模型建設的正能量內容供給,從底層邏輯上有效解決了大模型價值觀引導等問題。依托該自有語料庫,通過對基于Transformer架構的千億級別基礎模型Qwen2—7B—base進行增量預訓練、指令微調和檢索增強生成,打造面向中華民族共同體意識理解與價值觀對齊的大語言知識模型,并基于強大的自然語言生成能力,實現對中華民族共同體學領域知識體系的精準理解。
目前,該模型已具備以下功能:一是支持互動式問答,可幫助用戶深入了解中華民族多元一體的歷史事件、文化習俗、傳統藝術等知識;二是快速定位中華民族共同體學領域的研究成果,支持知識圖譜構建;三是為《中華民族共同體概論》等相關課程提供教學資源動態更新,以及民族學文獻、口述史、非遺影像等資源的智能化采集與增量式擴充等多項支持;四是幫助用戶解析國家民族政策,分析全國民族團結進步典型案例,提煉可推廣的經驗模式。
下一步,張瀟團隊將繼續整合相關領域研究優勢資源,分階段推進“鑄牢”大模型系統完善。一是加強基礎資源建設、二是加大核心技術研發、三是深化應用拓展,同步推進“鑄牢”大模型在教育、科研、政策等領域的示范應用。
圖 :“鑄牢中華民族共同體意識知識大模型”登錄界面