9月20日上午,信息學院大規模流數據集成與分析技術北京市重點實驗室邀請了酷克數據首席科學家楊勝文博士進行了題為“企業數據倉庫加速AI落地:方法、工具及大語言模型應用實踐”的學術報告和交流。本次報告由實驗室的王桂玲研究員主持,實驗室主任韓燕波教授代表實驗室師生對楊勝文博士表示了熱烈的歡迎,信息學院七十多位同學參加了此次學術活動。
楊勝文博士首先從數據平臺技術的演進過程入手,介紹了傳統技術中目前存在的問題,繼而引入了一個以HashData為代表的現代企業數據倉庫,并提出了企業數據倉庫和AI技術結合的新范式,這使得從數據處理、模型訓練到智能應用開發變得更加高效。楊博士具體介紹了一個數據科學和AI開發工具HashML,并從兩個語言模型ReQA和ChatData的具體實踐角度闡述了基于HashML的實際應用場景。在演講過程中,楊勝文博士還回答了老師和同學們的問題,與師生就相關問題進行了充分地交流和討論,現場氣氛熱烈。
楊勝文博士畢業于清華大學計算機系,現任酷克數據首席科學家。曾任百度大數據技術委員會主席、主任架構師、大數據部技術負責人,更早前在EMC、Yahoo Beijing Labs、HP Labs China從事研發工作。在大數據分析、數據挖掘、數據智能等領域深耕多年,在互聯網用戶理解、產業數據智能、人工智能行業應用等領域有著豐富的實踐經驗。獲得2022年度教育部科學技術進步獎一等獎。