第96章 老师是变态 王mua
吴辰能猜到她心中所想。
但这也正是他所希望的效果。
不论是姜楠还是闵欣柔,也不论感情如何发展。
和自己工作的时候,她们必须拿出工作时该有的状态。
而闵欣柔也不负他的期待,压下其他心思,开始思考如何解决问题。
过了半晌后,她终于想清楚了。
“老师,如果象我这样标记5000条数据是没有意义的,因为这些内容不是给人看的,是给机器看的,对吗?”
“思路对了,所以研究人工智能的时候,看似在和文本打交道,实际上最终都会转换为数学问题————那么接下来呢,应该怎么做?”
吴辰夸奖了一句。
能理解人的视角和机器视角的不同,是成为优秀工程师关键的一步。
受到鼓励,闵欣柔也大胆的放开了思路。
“我应该选选择出来5000条高质量的帖子,然后将这些帖子进行分词,然后将这些帖子拆分成最小的字符单位,编写一个脚本统计所有相邻字符对的出现频率,频率最高的组合就合并成一个新的词,循环往复,最后用您说bpe算法,来构建一个至少包含3万个常用token的中文基础词表。”
闵欣柔的意思是这样:
一口气说完,闵欣柔也终于明白了吴辰之前让她标注5000条数据的真正意图。
她感觉自己终于将看过的论文和手头正在做的事情串了起来。
“不错。”
吴辰点点头表示认可。
针对bpe算法的实现,他又提点了一番具体的思路。
特别是如何处理未登录词的边界情况。
接下来,闵欣柔只要按部就班的实现就好了。
帮她理清思路后,吴辰也要开始自己的工作了。
他想了想,拿出了马克送的新鲜苹果电脑,对闵欣柔道:“我要用这台新计算机工作,你等一会儿再做。”
闵欣柔下意识的问道:“那旧的呢?”
“旧的我————先给你用,你写数据处理算法对计算机性能有要求。”
吴辰说。
他目前需要做的工作是阅读文献和设计transforr的顶层架构,以便尽快完成gpt—1的开发,对计算机性能并没有太大要求,用苹果电脑看文档正合适。
而闵欣柔需要处理大规模的数据,正需要启明一号这样四卡并联的算力怪兽。
吴辰开始拷贝数据的时候,闵欣柔划着计算机椅帮他去泡咖啡。
趁着她不在,吴辰打算先把比较重要的日语学习资料给拷出来。
不过打开文档夹后,他突然发现最近访问目录中,竟然有他存放日语学习资料的打开记录!
难道闵欣柔打开看过?
这就让吴辰很尴尬了。
他有一个朋友喜欢玉足,所以在他的计算机上存放了许多奇怪的视频,标题也很夸张,如果让人以为是吴辰自己喜欢,那太冤枉了。
于是在闵欣柔泡咖啡回来后,吴辰神态随意的开口。
“计算机硬盘的空间不太够,我打算清理一下,你在上面没放什么数据吧?”
闵欣柔摇了摇头:“除了今晚发研究资料目录下的文档给您,我没有动其他的东西。”
“那就行。”
吴辰咳嗽一声后略微放下了心。
应该是她找文档的时候不小心点错了,毕竟研究资料和学习资料两个文档夹离的很近嘛。
闵欣柔是个乖孩子,肯定不会乱翻东西。
拷贝好自己的资料后,吴辰就将位置让开,坐到旁边开始和闵欣柔一起工作。
虽然已经晚上10点钟,但师徒俩都没有睡觉的打算。
闵欣柔是因为有了新的解决思路,急着进行实践。
而吴辰则是打算先解决苹果的问题。
虽然他跟马克约的是一星期后交出修复方案。
但他开启思维加速看了几个拆解视频,又用工程圣手研究了一番苹果的设计后后,就得出了两套解决方案。
这个问题其实既有英飞凌的基带芯片问题,也有苹果的设计问题。
所以吴辰给出了两套解决方案。
一套是短期的解决方案:
修改基带固件中的迟滞策略,将3g网络向2g切换的信号阈值降低3db,并增加500毫秒的判断延迟,防止在信号波动时出现乒兵切换导致的掉线。
另一套是长期的解决方案,需要修改硬件:
优化射频前端的供电电路,在基带芯片和功放之间增加一级稳压电容,防止高功率发射时的电压跌落导致基带复位。
至于怎么选,那就是乔布斯和马克需要做出的选择了。
问题解决后,吴辰从思维加速的效果中退出来,心情十分愉悦。
他只用了10分钟时间就换来帕罗阿尔托的设计文档。
一个字:值。
这就是那个经典的道理。
怎么拧螺丝不值钱,但知道在哪里拧螺丝才是最值钱的。
惬