為什么自適應學習系統不是K-12教育的救世主?
在《像淘寶店一樣做個性化學習推薦——論萊布尼茨系統的誕生》一文介紹了基于知識圖譜的個性化學習推薦系統的基本原理。那篇文章解釋了做一個合格推薦系統所需的人力成本和時間成本。如果一個教育公司不關心遺產而關心資產的話,它很難打造出在國際上有競爭力的自適應學習系統的。 這篇的觀點更為激進。即使我們能做出一個完美的基于知識圖譜的自適應推薦系統,也無法革命性地改進K-12教育的生產力(特別是在公立學校系統中)。請注意我并沒有為這個判斷加上“中國”這個限定詞;事實上,在美國K-12場景中,沒有任何一款以知識圖譜為基礎的自適應學習系統在大規模可控實驗中證明了教學效果的優越性。為什么自適應學習系統看上去這么美,現實卻這么殘酷?第一,K-12對于個人學習速度差異的容忍度太差(教學進度被大綱高度約束);第二,我們對于學習過程本身的理解太淺了,止于測評,而不及教學。因此,在不比寬度只比深度的K-12領域,自適應學習系統沒有優勢。這并不是說它一無是處,而是說需要找到它自己的產品市場契合(product market fit)。在學生學習自愿,學習深度較淺,學習速度是客戶剛需的學習任務中,自適應學習系統會有其用武之地。假設有人把《五年高考三年模擬》這套書變成一個基于知識圖譜的自適應推薦系統,它和紙質原版的優勢在哪里?有兩類題不用刷了:已經掌握的(比如答對概率>95%),根本沒有掌握的(比如答對概率<30%)。雖然不同人可以跳過的題是不相同的,但是我保守估計在相同效果下,每人的刷題數量可以降低30%以上。第一,前置知識點不掌握的優先刷;第二,過難的題目排后刷。作為自適應學習系統的副產品,用戶可以看到自己在各個知識點的掌握程度的估計。從提分的角度,我愿意大膽猜測這些改進并沒有什么用處:對于大部分高三學生而言,少刷題省下來的時間干什么?答案是繼續刷題。只要邊際回報率為正,即使是0+(向右趨近于0),學生也會刷題。在現行考評制度下,自學大學內容的回報率可能還是負的。對于非天才而言,如果刷題有用,還要老師干嘛?因此,單純的練習(即使是帶文字講解的練習)是有提分上限的;更高效的練習只是更早地碰到這個提分天花板而已。如果時間不夠,可能有人達不到這個天花板;但是對于大部分人而言,時間是充裕的。推薦非練習類學習內容?非常遺憾,這不是基于知識圖譜的自適應學習系統能夠做的。大部分買了《五年三年》的學生并沒有啃完這個大部頭,因為他們缺乏完成這項艱巨任務所必須的動機和毅力。盡管有證據顯示降低難度從而給與學渣更多的成就感可以增強他們的投入程度,但是從邏輯上講自適應學習系統本身并不解決動機問題。雖然改造《五年三年》是一個極端的例子,但是它是自適應學習系統在K-12應用困境的一個縮影。具體而言:(1)因為不鼓勵學習速度的差異化,所以提高速度沒有意義每個學段都有按部就班的教學大綱,老師的考核以完成這個教學任務為準,而不是以最大化學生學習內容為準。此外,因為公平的考量和師資能力的限制,也不鼓勵學生根據自己的節奏學習,學得快孩子還是得在終點線上等大部隊過來匯合。(2)對于教學指導而言,自適應教學系統的分析粒度太粗老師并不怎么關心粗粒度知識點的掌握狀況(比如一元二次方程的求根公式),而比較關心學生對于知識點細節的掌握(比如求根公式的b前面是不是忘記添加負號)。分析引擎不能提供細粒度的教學數據支持,就無法切入教學環節,提高教學質量。而之所以不能把老師批卷子的過程自動化,事實上體現了算法對于學習行為的理解還是太少。學習是承認自己的無知,并拿出撞了南墻也不回頭的倔勁與自己的無知做斗爭的過程。除非對于所學內容非常感興趣或者有超乎常人的意志力,否則學習就是一件反人性的事情。一個學生同時喜歡語數外+文綜三科或者理綜三科的概率小到可以忽略不計;因此總有一科(或者幾科)對于學生而言是打心底里討厭,再怎么自適應也是討厭。任何一個學習淘寶/amazon/Netflix/今日頭條的推薦系統,它都在第一個問題上做功夫;因為它必須做兩個核心假設:(2)系統的任務是識別并利用偏好,而不是改變偏好。然而不幸的是,學習這件事違反了這兩個核心假設。知識點的掌握程度是可變的,因而不是穩定的;學習系統的目的不僅在于識別知識點掌握程度的強弱,更在于讓學生習得其薄弱的知識點。如果說第一個假設還是個技術問題,那么第二個假設就是方向問題了。讓我繼續用淘寶推薦的例子來解釋目前主流的推薦系統和學習推薦的核心差別。假設明天教育部宣布,所有人都必須喜歡闊腿褲,而不能喜歡連衣裙。那么淘寶面臨的問題是,怎么樣引導用戶通過一系列搜索行為,讓歡樂頌同款連衣裙的粉絲最后買了闊腿褲。我相信有過協同推薦算法經驗的同志看到這個問題肯定是一臉蒙圈了,但是這就是學習推薦系統要解決的問題。教育部說所有人都要掌握力的平衡,但是現在用戶就是對找力無感,怎么樣通過一系列題目的練習使得用戶變成力平衡小達人?這個問題事實上涉及到我們對于學習過程的理解,而大多數情況下學習過程對于我們而言是一個黑盒。我也沒有看到哪家自適應學習系統真正系統性地思考這個問題。即使是行業標桿,在推薦時,主要以提高測評精度為主,而不是以提高教學效果為主。如果測評內容和學習內容的相關性不高,那么基于測評設計的自學推薦系統不能真正提分也不讓人驚奇。從美國經驗來看,真正有效的學習推薦系統是從后兩個問題入手的。這里介紹一個從第三個問題入手的翹楚,Reasoning Mind。Reasoning Mind將俄羅斯小學數學的紙質教案變成類似于人機對話的人工智能輔導,不僅大大提高了學生的課堂投入時間(根據一項測評指標投入度從60%提升到90%),而且多次在大范圍的隨機試驗中獲得統計上顯著的提分效果。而頗讓我震驚的是,Reasoning Mind事實上沒有任何比算平均分更復雜的測評技術。作者:馮俊晨
圖片來源:網絡
內容來源:愛行知(ID:k12edu-tech)
轉載:在線教育行業觀察(ID:edu-look)
1. 優學云測評推出培訓機構個性化教學解決方案
2. 優學云測評推出中小學校個性化教學解決方案
3. 優學云測評推出招生平臺流量提升方案
4. 優學云測評推出企業人才發展平臺解決方案——人才庫管理
5. 優學云測評幫助個性化教育成為現實
優學云測評精選的每一篇文章都會注明來源和作者(除非找不到),文章版權歸原作者所有,若有侵犯權益,請聯系我們刪除。本文所述內容僅代表作者觀點,不代表優學云測評立場。對于本文以及其中全部或者部分內容、文字的真實性、完整性、準確性和合法性本公眾號不作任何保證或承諾。