用戶登錄投稿

      中國作家協會主管

      當學生習慣AI寫作,老師能不能“用魔法對抗魔法”?
      來源:文匯報 | 陳曉菡  2024年08月30日08:42

      隨著人工智能(AI)大模型不斷升級,以ChatGPT、文心一言、BingChat等為代表的生成式AI工具對教育領域產生了極大的影響。這類技術工具可以按照用戶指令分析閱讀材料、翻譯文本、進行論文寫作并潤色,已經在高校學生群體中得到大量的關注與使用。

      那么,生成式AI工具寫作的內容文本究竟有哪些特征,局限性在哪里?就寫作而言,學生借助AI寫作,是否與大學開設人文通識課程的目標相悖?未來,我們有沒有可能讓這類生成式AI工具從“學術不端”的“幫兇”轉變為人文教育的“幫手”呢?

      生成式AI寫作工具,給教學帶來新挑戰

      筆者在一所中外合辦大學開設“中西文化比較”課程,這是學校的一門人文通識必修課,每年會有超過4000名學生選課并參加課程考核。過去,不少大一新生會帶著自己的高中作文摘抄本進入大學課堂,并在不自知的情況下進行引用,從而引發學術不端的問題。

      2022年OpenAI推出ChatGPT后,眾多互聯網公司也紛紛推出了各自的大語言模型。2023年之后,入學的大一學生也與時俱進,開始在作業或期末論文中直接使用最新的技術進行寫作。于是,學生提交上來的小論文,查重率高的現象明顯減少,同時,用AI工具寫作的痕跡明顯增多。

      幾千份課程期末論文中,10%以上有明顯的全文使用AI工具生成的痕跡,另有不少課程論文有局部使用AI軟件代寫的嫌疑。筆者在評閱作業過程中,也常發現有的學生在文末忘記刪除投喂給AI的指令、忘記刪除某AI寫作工具試用水印,或是用英文AI工具生成內容再用翻譯軟件翻成中文導致奇怪語法錯誤的案例。

      對學生而言,使用AI工具代寫論文顯然充滿誘惑:在短短幾分鐘內,只需輸入課程要求的論文選題,就能生成一篇還看得過去、且大概率能躲避系統查重的文章,尤其是在繁忙的期末,這為學生帶來了難以抗拒的便利。根據筆者的統計,在學生提交上來的具備AI寫作特點的文檔中,最短編輯時間只有1分鐘。但是從教學角度而言,此類AI工具的出現對老師的工作帶來了許多新要求與新挑戰。

      AI確實在輸出,卻并非寫作論文

      近兩年內,網上出現了許多內容完整、邏輯通順的AI生成論文,甚至讓人難以辨認這些作品是否由真人寫作。但是在筆者面對的上千份課程期末論文中,AI寫作的特征非常明顯。

      首先是格式與結構的雷同。這類文章往往生硬地在段首使用“首先”“其次”“最后”“總結”等詞語,試圖給讀者形成邏輯明確、主次有序的印象。然而,在每段的闡述中,卻只有寥寥幾筆的空泛之言,會讓人覺得“就這么點單薄的觀點,還需要分一二三四這么多層次嗎?!”

      同時,由于生成式AI寫作工具并不是真正的思考,而是依據用戶輸入的關鍵詞在海量數據中檢索、再重新組織出語言,因此它在生成文章時也非常強調關鍵詞的輸出,并以圍繞相應關鍵詞的答題式格式呈現出來,導致這類文本在格式與結構上的同質化。

      比如,圍繞主題“從教育的角度討論中西方文化的差異”的論文,用AI寫作的學生文本內容格式都非常清晰,甚至可說“對仗工整”,文本往往圍繞著幾個關鍵詞,進行清晰的分點陳述。但實際上,只需要認真看一下就會發現,文章有一種生硬的、答題式的割裂感,與課程要求的“行文完整”相差甚遠。

      再以和教育傳統有關主題的小論文為例,通過AI生成的內容中均提到中式教育和西方教育各自的特點,這些論斷都是大家耳熟能詳的,然而這些表述卻與我們課程中相應專題所要傳達的觀點南轅北轍,如果學生結合了課程所學,絕對不會羅列出如此片面的表述。比如,我們在專題《書院與大學》中,就對比了兩宋時期中國的書院與西方中世紀盛期隨著城市興起而逐漸誕生的大學,并為學生提供了延伸閱讀的論文與書目。AI生成的小論文完全不會涉及到相關的案例與史料。

      被“投喂”的答案不斷加深學生刻板印象

      事實上,我們的課程之所以被列為通識人文必修課,在教學目標中就涵蓋了“增進學生對于中西方文化多樣性的認知,在此基礎上形成并堅定對自身文化的認同感”。課程通過比較研究的方法,希望可以打破學生此前的某些既有印象,獲得更廣闊多元的研習視角,而AI生成的內容卻以無法保證準確性的同質化觀點,不斷加深學生的刻板印象,助長文化偏見。

      究其原因,這類AI寫作工具并非真正的思考主體,它們的運轉機制是在人類生成的大量文本中提取數據,再通過整合生成答案,因此這些答案的生成取決于在網絡世界中被“投喂”了哪些數據,以及“投喂”了多少量,很容易引發偏見問題。

      同時,AI生成內容無法保證其準確性。例如,在一篇作業中,出現了將宋代詩人陸游所作《秋夜將曉出籬門迎涼有感》誤寫為“唐代詩人杜牧的《秋夜將曉樹桑鳥》”的常識錯誤,還出現了“明代小說《紅樓夢》”等錯誤說法,再搭配上查無此證的參考文獻,可謂一本正經胡說八道了。

      同時,AI生成的文章行文邏輯混亂無序。與內容錯誤并行的是行文缺乏清晰、合理、有序的邏輯,這更加劇了這類文本“胡說八道”的程度。在一篇試圖從經濟發展的角度討論中西方文化差異的作業中,提到中國文化的優點在于注重家庭和社會的關系,這一觀點也出現在許多AI生成的其他不同主題的作業中。更不用說,眾多重復、錯亂的語句,占據了全文大量篇幅。

      讓AI從助長“學術不端”轉向“學習助手”

      生成式AI工具已經越來越深地介入高校學術寫作,針對此類技術進行規范治理迫在眉睫。但是筆者在面對近兩年眾多學生使用AI生成的文本時,還發現了一些有意思的現象,這不禁令人思考:除了在規范、制度的層面對AI工具的使用進行管理,對于教師而言,是不是可以從課程設計、教學模式等角度進行改革,從而使技術從助長“學術不端”轉變為“學習助手”?

      首先,這類生成式AI工具不擅長針對一些比較復雜且精細的問題輸出論文。課程期末考核要求學生只需在3道題目中選擇一道進行寫作,有兩道的題目比較宏大,一道比較具體(需要學生設定具體的歷史情境與人物)。結果,所有被認定為提交了AI代寫作業的學生,選擇的題目均為前兩道,且AI生成內容的特征非常典型。

      回顧學期中作為平時作業的小論文,寫作的題目均和相應專題緊密結合,且列出了學生需要讀的具體文獻和需要完成的實踐內容。例如,關于“城市與商業”專題,學生需在觀摩《平江圖》、走訪蘇州古城、參觀蘇州市規劃展示館的基礎上,結合國內外學者撰寫的城市研究論著,討論有關歷史上中國城市規劃和坊市制度演變的問題。這類主題的論文,幾乎不會出現AI生成的情況。因此,在課程內容和任務設計中,教師不妨避免設置容易泛泛而談的問題,而將問題與課程專題結合更為緊密,甚至強化實踐性、體驗性的要求,促成學習者更多地參與。

      其次,學生選取的國外AI軟件和國內AI軟件所生成的論文風格有明顯差異。這不禁引發一個疑問:到底是國內和國外的生成式AI工具“寫作”能力不同,還是選取不同AI工具的學生本身在提問、組織文本內容時存在差異?

      其實,即使在都使用了AI技術生成全文的情況下,同一主題的文章質量也有高低。所以,老師其實也可以在教學過程中,借助這一現象,從比較文化的角度引導學生對AI生成的內容進行批判性思考。例如,對比學生本人所寫的內容與AI生成的內容;對比不同AI工具針對同一主題/問題所給出的答案;對比免費與付費的AI工具所生成的文本,去追問不同文本之間有何差異,為什么會出現這種差異?然后,老師可以再將這種對比與分析的過程呈現到作業之中,一方面能避免學生直接將考題喂給AI“坐享其成”,另一方面,能夠在引導學生合理使用新技術的同時加深對課程專題和相應議題的理解。

      面對生成式AI工具,老師與其擔心學生會因其變得“懶惰”而抗拒、禁止它,不如在新的教學任務中將其轉變為能夠讓學生發揮更多自主性、提升參與感、主動發現問題、提出問題的助手,畢竟AI生成文章內容的質量與提問的角度息息相關。

      可以預見,未來會有越來越多的作業內容帶有AI生成的痕跡。除了在教學過程中進行新的嘗試,期待學校對AI技術的使用作出更健全的規范,在這里,我們或許可以再留一個問題:目前的生成式AI技術往往被學生一方用來代寫論文,那么會不會有一天出現了能自動評閱論文的AI軟件,如果學生們知道老師“用魔法對抗魔法”采用AI技術來生成分數,還會不會那么放心大膽地依賴AI進行全文代寫?

      (作者單位:西交利物浦大學中國文化教學中心、同濟大學人文學院)