5月15日,量化私募念空科技向國際頂會(huì)NIPS(Neural Information Processing Systems,神經(jīng)信息處理系統(tǒng)大會(huì))投遞了與上海交大計(jì)算機(jī)學(xué)院合作的大模型研究論文,有業(yè)內(nèi)人士認(rèn)為,這是中國量化機(jī)構(gòu)首次在AI基礎(chǔ)研究領(lǐng)域挑戰(zhàn)全球頂級學(xué)術(shù)舞臺(tái),標(biāo)志著中國金融科技不止于“應(yīng)用落地”,還具備“底層創(chuàng)新”能力。
(圖片來源:論文截圖)
大模型底層理論獲突破
據(jù)了解,念空科技成立于2015年,是市場上較早將AI應(yīng)用于金融領(lǐng)域的量化私募,機(jī)器學(xué)習(xí)應(yīng)用的數(shù)據(jù)范圍從期貨到股票,不斷地?cái)M合、嘗試。2019年,幾乎全部轉(zhuǎn)向神經(jīng)網(wǎng)絡(luò)算法,2020年起,念空科技在此基礎(chǔ)上搭建全流程投研平臺(tái),次年管理規(guī)模已突破百億元。
事實(shí)上,2021年起,量化私募在幾家知名機(jī)構(gòu)的引領(lǐng)下,越發(fā)被市場所熟知,實(shí)現(xiàn)從0到1的質(zhì)變,AI模型與算力競爭正重塑著行業(yè)。
2023年,OpenAI的ChatGPT橫空出世,在念空科技創(chuàng)始人王嘯看來,與傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法對金融數(shù)據(jù)進(jìn)行擬合不同,大模型對下一個(gè)token的預(yù)測本質(zhì)上是一個(gè)自回歸問題,大模型的出現(xiàn)提供了量化行業(yè)一個(gè)全新的算法工具。但ChatGPT的問題是使用成本較高,且使用權(quán)限較低,很難進(jìn)行大規(guī)模訓(xùn)練。
今年,DeepSeek因其開源的特征打破多種限制,實(shí)現(xiàn)“智能平權(quán)”,同時(shí)讓世人看到強(qiáng)化學(xué)習(xí)對大模型的推理能力至關(guān)重要。此前,DeepSeek將整個(gè)訓(xùn)練過程被分成監(jiān)督微調(diào)(sft)—強(qiáng)化學(xué)習(xí)(rl)—監(jiān)督微調(diào)(sft)—強(qiáng)化學(xué)習(xí)(rl)四個(gè)過程,像是集中一段時(shí)間學(xué)習(xí)刷題(sft),在集中一段時(shí)間參加考試對考試結(jié)果進(jìn)行思考總結(jié)(rl)。
念空科技所遞交的念空大模型論文的突破性成果在于,從人類的學(xué)習(xí)方法的經(jīng)驗(yàn)得到啟發(fā),如果高頻的在少量刷題和小測試經(jīng)驗(yàn)總結(jié)之間切換,可能更有利于學(xué)習(xí)成績(推理能力)的提高,故設(shè)計(jì)了一種step by step切換sft和rl的訓(xùn)練方法,在下一個(gè)step訓(xùn)練之前根據(jù)設(shè)計(jì)的自適應(yīng)的算法決定下一個(gè)step用sft還是rl,最終實(shí)驗(yàn)發(fā)現(xiàn),在三個(gè)不同的公開數(shù)據(jù)集上,念空科技提出的新的訓(xùn)練框架明顯優(yōu)于單獨(dú)的sft、單獨(dú)的rl以及簡單混合sft和rl,證明提出的新的框架是當(dāng)下更優(yōu)的后訓(xùn)練方式。通俗的說,念空的研究成果可以幫助大模型在同等訓(xùn)練量下變得更聰明。
(圖片來源:論文截圖)
不斷探索AI技術(shù)邊界
為了具體問題的技術(shù)研究和模型優(yōu)化,王嘯在2025年成立了AllMind,專注于研究通用大語言模型(LLM)相關(guān)底層算法和工程技術(shù)。
據(jù)介紹,AllMind,全稱為“上海全頻思維人工智能科技有限公司”,簡稱“全頻思維”,是由一家量化私募孵化的在大模型領(lǐng)域產(chǎn)出真正研究成果團(tuán)隊(duì)。AllMind致力于探索人工智能的前沿課題,主要研究方向?yàn)榇竽P偷讓蛹夹g(shù)研究和不限于金融場景的垂直應(yīng)用。
與念空科技主攻金融垂直場景不同,AllMind的定位為高質(zhì)量CoT數(shù)據(jù)生產(chǎn)方向的學(xué)術(shù)探索,包括大模型通用領(lǐng)域的研究工作也有金融場景的垂直應(yīng)用,希望在AI的基礎(chǔ)研究有所突破從而輻射到包括金融在內(nèi)的更多領(lǐng)域,為業(yè)務(wù)提供更多的可能性和想象空間。
此外,據(jù)介紹,念空是量化私募基金,盈利企業(yè),而AllMind更著眼于大模型的基礎(chǔ)學(xué)術(shù)研究和應(yīng)用,短期內(nèi)并不以盈利為目的,且兩家公司工作內(nèi)容完全不同。
國際AI格局有望重構(gòu)
優(yōu)秀的個(gè)人只能決定你的下限,而優(yōu)秀的團(tuán)隊(duì)才能決定你的上限,尤其是對于量化投資這種環(huán)節(jié)眾多、嚴(yán)謹(jǐn)?shù)耐堆心J絹碚f,團(tuán)隊(duì)合作顯得尤為重要。在該投研體系下,念空科技的研究部門可以專心做研究工作,技術(shù)部門專心做IT工作,每個(gè)人都在自己的崗位上做深做細(xì),共同推進(jìn)整個(gè)公司研發(fā)能力。
值得一提的是,與一般的金融機(jī)構(gòu)招聘不同,量化投資的門檻往往較高,通常是數(shù)學(xué)、統(tǒng)計(jì)學(xué)、金融學(xué)、計(jì)算機(jī)技術(shù)的結(jié)合,通過挖掘海量數(shù)據(jù)、尋找規(guī)律、作出預(yù)測,并使用這個(gè)規(guī)律進(jìn)行自動(dòng)的計(jì)算和決策,需要克服人性弱點(diǎn)。
對于核心人才的選擇,念空科技更愿意從零開始培養(yǎng),公司團(tuán)隊(duì)70%—80%的AI工程師都是從高校實(shí)習(xí)生或是應(yīng)屆生招進(jìn)來,在幾個(gè)月的時(shí)間里,他們會(huì)使用公司的體系、規(guī)則,公司逐步就能判斷這個(gè)人是否適合念空科技。
DeepSeek的開源讓大模型技術(shù)突破西方封鎖,讓“智能平權(quán)”。此次,念空科技與上海交大計(jì)算機(jī)學(xué)院合作的大模型研究論文,讓念空科技用實(shí)際行動(dòng)再次證明量化團(tuán)隊(duì)對AI算法的長期積累,具備大模型孵化器的能力,可以在AI領(lǐng)域貢獻(xiàn)一份力量,更多的量化團(tuán)隊(duì)加入大模型的理論研究有助于提升中國在國際AI領(lǐng)域的話語權(quán),也能為中國AI產(chǎn)業(yè)在全球競爭中贏得優(yōu)勢奠定堅(jiān)實(shí)的基礎(chǔ)。
未來,隨著念空科技持續(xù)加大在AI基礎(chǔ)研究與應(yīng)用開發(fā)的投入,其在社會(huì)價(jià)值創(chuàng)造與國際科技競爭中的表現(xiàn)值得期待。念空科技正以創(chuàng)新為驅(qū)動(dòng),引領(lǐng)中國量化投資與AI技術(shù)走向更加輝煌的未來。(CIS)
校對:冉燕青