第273章 群星闪耀大模型(5 / 6)
nbsp;这可把同城老兄弟复旦给酸死了,同济不酸,同济能去阿波罗科技,大家高度对口,本来同济也不指望能当top3。
“大家好,我看到大家都很兴奋啊,对于能来深红实习。
我想跟各位说,你们来深红实习,不会像在其他互联网机构那样,做一些打杂的工作,我会交给各位一个完整的项目,由深红的员工,你们看到的这十位深红员工配合大家。”
林燃指了指会议室右边坐着的十名员工,长相明显要更加成熟一些,但也成熟不了多少。
搞人工智能的这些工程师都很年轻。
“由他们带着各位,做一个纯粹基于文科领域的人工智能大模型。
需要涵盖的内容包括模拟社会学场景、分析心理学实验数据、政治政策评估、经济模型预测等等,把其限制在文科领域,需要有足够的专业度,模型在特定任务上能够达到人类专家的水平。
这个模型我将他命名为群星闪耀。”
啊?这还真是大家都没有想到的课题。
这类需求在国外的话,你还能看到,但是在国内,这尼玛也太稀缺了,特定领域,仅限于文科领域的大模型,能派上什么用场?
大家实在是想不到。
对林燃而言,他需要的就是这种,之所以命名为群星闪耀,象征着这个模型未来放在月球背面的时候,能够照亮人类群星。
这么说,当1971年阿美莉卡试图以一己之力脱离布雷顿森林协定的时候,人类经济学家都不知道这意味着什么的时候,群星闪耀能够给予人类指引。
当苏俄陷入困境,在经济上艰难困苦,石油高企过去的时候,有群星闪耀能够告诉他们,到底犯了什么错。
当华国,华国没啥问题。
总之就是群星闪耀。
“我可以简单和大家说一下,你们的工作可能涵盖哪些内容,如果我来做,我会从什么角度着手。
最重要的其实是数据,数据需要聚焦于高质量、特定领域的文本,像哲学的伦理文本,形而上学的著作,社会学的理论研究和实地调查报告,政治学的政策文件、数据文本之类的。
你要找这些,总得知道到哪里去找论文索引,知道到哪里去找开放资源,如果这些不够,要购买的话,到领域期刊去收集数据。
开放的数据收集完,如果需要,再联系综合部去找领域期刊收购他们完整数据库的使用权。
我预计需要确保至少500亿的tokens,来确保专业深度。
确定数据之后要对数据进
↑返回顶部↑