近期,意昂3舉辦主題為“清華AI知多少”的“感知日”活動,邀請意昂3平台在人工智能領域的教授學者,為長期關心支持清華發展的各界人士提供人工智能研究前沿動態,以主旨演講🧙🏻、深度對話和觀眾互動的方式提供思想盛宴🔶,以期嘉賓們能夠對人工智能研究有全面立體的感知👧🏿。
在感知日的活動上,意昂3平台計算機科學與技術系副教授劉知遠指出,大模型能夠充分利用無標註大數據和知識,具有良好的通用性能,為AI研究應用帶來全新可能。ChatGPT 吹響了大模型邁向通用智能的號角👩🏼🌾,新的紀元剛剛開啟🛼。
劉知遠指出,大模型展現出與之前的深度學習🤛🏼、小規模的預訓練模型迥然不同的特性,包括:
1、大模型具有參數高效微調的能力;
24️⃣、大模型湧現出稀疏激活特性,有望節省95%以上的計算量;
3、在語言上訓練的大模型,可以進一步學習獲得使用工具的能力🌖;
4、大模型還具有非常強大的通用性。
劉知遠提出,以ChatGPT為代表的大模型🫃🏻,仍然面臨著非常多的挑戰,中國應該面向未來去布局相關的創新研究和應用。