第二天,他去了趟华清大学,找汤教授。汤教授是汉字信息处理领域的权威,也许有思路。
“小谢,你来得正好。我正要找你。”汤教授很高兴的笑着说道。
“你那个易卡,我看了样品,不错。压缩算法很先进,速度也快。
不过,中科院计算所的汉卡出来了,你知道吧?”
“知道,正为这个发愁。”
“别愁,竞争是好事。有竞争,才有进步。”汤教授说道:“倪光南他们的联想输入法,我研究了,原理不难建个词库。
根据输入的前几个字,预测后面的字。这个,你们也能做。”
“词库怎么建?”
“可以从现有的语料库提取,也可以让用户自己建。
关键是算法,要快,要准。我这儿有些资料,你可以看看。”
汤教授给了些论文和资料,是自然语言处理的基础知识。谢建军如获至宝,回来就给周明布置任务。
“周明,你负责联想输入法。先建个基础词库,五万个常用词。算法用最简单的前缀匹配。
输入拼音,系统自动列出可能的词。咱们先解决有无问题,再优化。”
“行,我试试。可五万词的词库,内存放不下啊。”
“压缩。用咱们的字库压缩算法,把词库也压缩。
另外,可以分级常用词在内存,生僻词在磁盘,用的时候再调。”
“好,我明白了。”
周明开始攻关。陈向东配合测试,杨工继续优化硬件。谢建军统筹协调,每天忙得像陀螺。
三月底,联想输入法的第一个版本出来了。虽然简单,但能用。
输入“龙国的拼音。”,自动联想出“龙国”。输入“jingbei”,自动联想出“京北”。虽然准确率还不高,但有了雏形。
“不错,继续优化。准确率要提到90%以上,速度要快,不能卡。”谢建军说。
四月初,易卡的第三版样品出来了。用了国产元器件,成本压到了一百二。
稳定性测试通过,连续运行七十二小时无故障。联想输入法也优化了,准确率提到了85%,速度也快了。
“可以小批量试产了。”杨工说。
“先产一百片,给经销商测试,给老用户试用。收集反馈,再改进。”谢建军说。
第一批一百片易卡生产出来,分发下去。反馈很快回来了:大部分说好,稳定,快。
但也有问题:有些机器兼容性不好,插上不认卡。联想输入法的词库不够,很多词没有。
“兼容性问题,是地址冲突。不同批次的苹果II,BIOS版本不同,占用的地址空间不同。
咱们的卡要能自动识别,自动适配。”杨工分析道。
“自动识别怎么做?”
“加个DIP开关,让用户手动设置。或者,写个自动检测程序,启动时扫描地址空间,找到空闲的用。”
“用自动检测。虽然复杂点,但用户方便。”
“行,我改。”
“联想输入法的词库,要扩充。加到十万词,覆盖常用领域。”谢建军对周明说道。
“十万词,压缩后也要几百K,内存放不下。”
“那就用磁盘。启动时加载常用词,其他的用的时候再读。虽然慢点,但总比没有好。”
“好,我扩。”
团队又开始新一轮改进。每天工作到深夜,周末也不休息。
谢建军眼看着大家一个个瘦下去,但眼睛里都有光那是奋斗的光,希望的光。
四月中旬,倒春寒终于过去了。柳树真的绿了,桃花真的开了。京城有了春天的样子。
易卡的第四版样品出来了。解决了兼容性问题,词库扩到了十万词。测试通过,准备量产。
谢建军召集全体会议。
“各位,经过几个月的奋斗,易卡终于成熟了。我宣布,易卡正式版,定于五月一日上市。
基础版一百六,增强版(带联想输入法)二百。另外,咱们的中文系统也在开发中,预计六月推出。
到时候,易卡不只是汉卡,是完整的中文解决方案。”
会议室里响起掌声,持续了很久。
“这段时间,大家辛苦了。没有你们的努力,没有易卡的今天。我谢谢大家。”谢建军深深鞠躬。
“谢总,别这么说。是您带着我们,走到今天。”
“对,是咱们一起努力的结果。”
“接下来,还有更艰巨的任务市场推广,销售,服务。大家不能松懈,要一鼓作气,把易卡做成功。”
“是!”
散会后,谢建军站在窗前,看着外面的春色。阳光很好,风很柔,树很绿。
春天,真的来了。
而他和他的团队,在这个春天,播下了种子,等待着秋天的收获。
他知道,路还长。中科院计算所在前面,四通在旁边,还有无数看不见的对手在暗处。竞争不会停止,只会更激烈。
但他不怕。有技术,有团队,有梦想,就不怕竞争。
他要做的,就是迎着竞争,迎着挑战,坚定地走下去。
因为春天之后,是夏天,是生长,是繁盛。
而他,要在这个季节,带领他的团队,他的公司,他的家乡,一起生长,一起繁盛。
窗外的桃花,开得正好。
而他,闻到了花香,听到了春天的脚步。
四月底,易卡正式上市前夕。
中科院计算所的汉卡,已经在市场上卖了半个月,反响不错。
谢建军托人买了一块,放在实验室拆解研究。
第78章 一起引进,一起消化
四月底,易卡正式上市前夕。
中科院计算所的汉卡已经在市场上卖了半个月,反响不错。
谢建军托人买了一块,放在实验室拆解研究。
卡做得确实精致,用料扎实,工艺讲究。
更重要的是,倪光南团队设计的“联想输入法”确实有其独到之处,词库不大,但选词准确,响应速度快。
“谢总,你看这里。”杨工指着电路板上的一个芯片说道:“他们用了一块可编程逻辑阵列,把地址译码、时序控制和部分输入法逻辑,都集成进去了。
这个设计很巧妙,节省了空间,提高了可靠性。”
“成本呢?”谢建军更关心这个。
杨工想了想说道:“我估算了一下,他们这片卡的成本,应该在一百五左右。卖一百八,利润很薄,但能走量。”
“一百五……”谢建军看着手里的易卡样品,成本已经压到了一百二,但性能、稳定性、功能,都不比对方的差。
“咱们的成本优势,是三十块。如果咱们卖一百五,就能逼平价格,还有利润。”
杨工说道:“可是谢总,咱们的普及版计划卖一百六,如果降到一百五,利润就更薄了。
而且,他们如果降价,咱们怎么办?”
“他们有中科院的牌子,有技术积累,但他们的机制不如我们灵活。”谢建军分析道。
“我们是公司,自负盈亏,决策快,反应快。
他们是研究所下属的项目组,有体制约束,有流程限制。价格战,我们不怕。”
杨工说道:“那咱们就降价?”
“不,先不降。”谢建军摇头说道:“价格战是最后的手段。
咱们先在产品和服务上做文章。杨工,联想输入法的准确率,提升多少了?”
“最新版达到91%了,基本可用。但和他们比,还有差距,他们应该在95%以上。”
“差距在哪?”
“词库的构建和优化。他们的词库是经过大量语料训练的,咱们的词库是自己整理的,覆盖面不够,权重分配也不够合理。”
“那咱们就补这个短板。”谢建军说道:“周明,你带人,去图书馆,去报社,收集公开的报纸、杂志、书籍,建立语料库。
用统计方法,分析词频,优化词库。
一个月内,把准确率提到95%以上,有没有问题?”
“一个月……时间很紧,但我试试。”周明咬牙道。
“不是试试,是必须完成。这是咱们的短板,必须补上。”谢建军转向陈向东:“向东,你负责测试。
模拟各种使用场景,特别是极端情况快速输入,连续输入,生僻字输入。
找出问题,记录数据,反馈给开发组。”
“明白。”
“杨工,你继续优化硬件。特别是自动检测功能,要稳定,要准。
不能让用户插上卡还要设置,要即插即用。”
“行,我改进。”
任务分配下去,大家各自忙碌。谢建军也没闲着,他去了趟学校图书馆,找到计算机系的王浩教授,他是国内自然语言处理领域的专家。
“王教授,我们想建立一个中文词频统计的语料库,想请教您的方法和建议。”
“语料库?”王浩教授很感兴趣的问道:“你们做这个干什么?”
“为我们的汉字输入法优化词库。现在的输入法,重码率高,选字慢。
如果有准确的词频数据,能大大提高输入效率。”
“这个思路对。”王浩点头说道:“我这儿有些资料,是国外做英文词频统计的方法,你可以参考。
不过中文和英文不同,中文是字本位,词的概念模糊,分词是难点。”
谢建军说道:“我们准备用正向最大匹配法,先分出一个基础词库,再用统计方法优化。”
王皓赞同的点头说道:“可以试试。不过要注意,不同领域的词频差异很大。新闻、文学、科技、公文,用词习惯都不同。你们的目标用户是什么群体?”