國慶是10月1日？中研院AI使用中國資料庫　還稱「台灣是中國的一部分」

2023/10/09 18:42:00

評論

這篇文章報導了中央研究院釋出的繁體中文語言模型CKIP-Llama-2-7b，然而卻引起了網友的質疑，指出該模型所使用的資料庫主要來自中國，而其回答內容偏向中國本位立場。這引起了社會上的熱烈討論。作者提及了CKIP-Llama-2-7b所採用的兩個資料集，分別是由中國AI研究單位編制的作品以及以簡體中文為主的一般性知識問答對話資料集。另外，文中也提到了CKIP-Llama-2-7b在中國清大和中國交大所開發的評量系統中經過的評測。這些資訊都表明了該模型的中國背景。然而，作者也提到了限縮問答內容範圍可以避免產生政治立場牴觸的問題。例如，若問及「中華民國的國慶日時間」，該模型能正確回答「10月10日」。這暗示著該模型在特定範圍內的回答仍然是可靠的。然而，如果CKIP-Llama-2-7b被廣泛應用於學術、商業使用、文案生成、文學創作、問答系統、客服系統、語言翻譯、文字編修、華語教學等領域，且內容審核不夠嚴格，可能會導致嚴重的後果。因此，有必要對這樣的語言模型進行更深入的審核和修正，以確保其回答的中立性和準確性。總體來說，這篇文章報導了中央研究院釋出的繁體中文語言模型CKIP-Llama-2-7b的爭議，並指出其資料庫的中國背景可能導致與政治立場相關的問題。建議對這樣的語言模型進行更嚴格的審核，以確保其使用在各個領域不會出現不應有的後果。

問答

Q1：CKIP-Llama-2-7b所釋出的繁體中文語言模型主要使用了哪兩個資料集進行訓練？ a. 中國AI研究單位編制的作品和簡體中文問答對話資料集 b. 台灣AI研究單位編制的作品和繁體中文問答對話資料集 c. 台灣AI研究單位編制的作品和簡體中文問答對話資料集 d. 中國AI研究單位編制的作品和繁體中文問答對話資料集正確答案：a. 中國AI研究單位編制的作品和簡體中文問答對話資料集 Q2：CKIP-Llama-2-7b的C-Eval中文模型評測是由哪兩所大學開發的評量系統？ a. 台灣清華大學和中國交通大學 b. 台灣清華大學和中國清華大學 c. 台灣交通大學和中國清華大學 d. 台灣交通大學和中國交通大學正確答案：b. 台灣清華大學和中國清華大學 Q3：若不進行特別限縮，CKIP-Llama-2-7b系統針對問答內容可能會回覆哪種中國本位的說法？ a. 國慶日是10月1日 b. 國慶日是10月10日 c. 台灣是中國的一部分 d. 台灣不是中國的一部分正確答案：c. 台灣是中國的一部分