第116章 沉默的温柔 王mua
榛果seek回答问题时有时聪明,有时智障,其实有一个重要原因。
那就是:过拟合。
它的参数量不够大,泛化能力没有涌现,所以它的回答无限接近于闵欣柔整理好的语料。
而且为了让回答有意义,吴辰不得不降低模型的发散性,它在面对未知领域时显得更加呆板。
不过过拟合也有好处。
在2008年这个蛮荒时代,过拟合恰恰是一个巨大的护城河。
在大家还不知道大模型存在时,他们绝不会想到屏幕上那些引经据典、语气沧桑的文本,竟然不是真人敲出来的。
ai最擅长的,就是用确定的语气,回答已知的存量知识。
那么针对它的这个特点,目前最好的一个产品:
就是:问答社区!
2008年是一个非常特殊的时间点。
此时国外的quora还要一年才成立,国内的知乎还要两年才成立。
所以这个世界上,还没有一个高质量的问答社区。
大洋彼岸的quora要等到明年才成立,国内的知乎更是两年后的产物。
此时的中文互联网,是一片知识荒漠。
大家找答案,要么在搜寻引擎的gg里大海捞针,要么去百度知道看那些楼主好人、同求甚至是复制粘贴的垃圾信息。
那高质量的回答有没有呢?
自然是有的。
但它们散落在天涯的深水区、猫扑的置顶帖、贴吧的精品区里,像珍珠一样被泥沙掩埋。
吴辰要做的,就是把这些珍珠串起来,做一个聚合全球智慧(其实是ai马甲)的高端社区!
而且要墙内墙外两开花!
听到他的计划,闵欣柔的眼中也亮起了光。
做为一个程序员,最难受的不是开发软件时的困难。
最难受的是开发出来的软件没有人用!
吴辰上辈子的导师就曾说过,一款软件做的太好但是没人用的话。
那就是垃圾!
所以听到自己写的算法和清洗的数据,将成为全球数亿用户获取知识的源头,闵欣柔也很是激动。
这种成就,真的很难用钱来衡量!
“老师,我想帮您!”
闵欣柔期盼的说。
吴辰点了点头。
“我和你说这些,自然就是想让你也参与其中————不过我有个要求。”
他敲了敲桌子,严肃道:“我所有的想法,你都不能轻易透露给别人,明白吗?”
“明白!”
闵欣柔使劲点头,恨不得赌咒发誓自己会绝对忠诚。
当然吴辰也不需要她这样。
分词算法虽然重要。
但最内核的transforr架构和模型权重,已经被他封装在只有他能解开的黑盒里了。
时光匆匆。。
但付出总是有回报的。
在以京大计算机学院副院长李祈正为首的合作方过来时,吴辰已经调试好了第一版可用的sdk。
“吴教授,我还以为你把我们都忘了呢!”
在机场接到李祈正时,他乐呵呵的对吴辰开玩笑。
“这我哪里敢,李院长您可是冤枉我了。”
吴辰连忙道歉。
实际上两人在在线也交流过几次,但更多的时候吴辰是和陈蓓桃交流。
不过陈蓓桃主要负责的是图象处理方面的工作,目前还没有突破性的进展。
听到他的话,陈蓓桃从姜楠怀中探出头来。
“院长,吴大佬还真没乱说,每周都和姜姜在深圳双飞呢————哎呀!”
她话还没说完,就被姜楠敲了一下脑袋。
李祈正也知道陈蓓桃的话总是很奇怪,所以并没有在意。
他只是看向姜楠道:“这位就是姜老师是吧,久闻大名了。”
“李院长您好。”
姜楠松开好久没见的闺蜜,上去和李祈正握手。
不过她有些奇怪为什么对方怎么会知道自己。
李祈正笑道:“姜老师最近可是把国外搅的天翻地复啊。”
姜楠这才明白是怎么回事,笑了笑后淡淡道:“都是吴辰的功劳。”
李祈正呵呵笑了几声,目光掠过她的脸,又看了看旁边陈蓓桃,暗自叹了口气。
倒是吴辰十分迷惑。
怎么还有自己的事?
朝停车场走去的时候,他悄悄问姜楠:“姜总又搞了什么大新闻?”
姜楠还没说话,陈蓓桃就叉腰叫了起来。
“大佬,你也太不关心我家姜姜了,为了你,她都得罪了不少人,你知道打假aβ56这件事有多危险么?”
之前吴辰帮江东药厂把这个坑躲过后,就没有再花精力关注了。
没想到竟然还有后续。
通过陈蓓桃叽里呱啦的一阵讲述,他才明白是怎么回事。
她利用吴辰提供的图象算法,检测出《自然》上的多篇关于阿尔茨海默症的内核论文,都存在严重的图象拼接与伪造痕迹