我将继续与您分享《段落 》 一书中的章节,这是第一家征服世界的俄罗斯创业公司。
在上
一期关于哈布雷的出版物发表之后
,已经过
了一个体面的时光-将近两个月。 在这里我可能应该道歉。 作为借口,我要说的是对我来说主要的工作是写书。 出版仍然是次要的。 我只有在处理完手稿后才有时间张贴。
在这两个月中,我写了几章,将草案增加到23万个字符(目标是40万个字符)。 此外,在此期间发生了另一项重要事件:该书出现了最终标题:
“硅谷先锋”。但是要点。
今天,我想分享一章,我希望哈勃的读者应该特别感兴趣。 毕竟,它讲述了“段落”创建的手写文本识别器的原理。
好吧,有行动-我们的英雄们首先来到美国,联邦调查局特工出现在了舞台的最前面。

最后,我提醒您,只需注册时事通讯 ,您就可以获取本书的所有11个现成的章节。 下载链接将以欢迎信的形式出现。
等待反馈和评论。 建设性的批评将有助于使本书更好。
走吧
八辣根
“告诉我,我在哪里可以得到政治庇护?” -首先要问帕奇科夫飞机何时降落在美国。
该问题以俄语提出,并交给了苏联航空公司的代表,他站在舱口并护送乘客离开飞机。
曾经有一次这样的笑话,苏联公民的官员会遇到大麻烦。
最有可能的是,他会掉落在克格勃的掩护下,他们会设法迅速将他送回家,在那儿,小丑可能被判犯有叛国罪。 在其他国家生活的愿望被认为是对祖国的背叛。
在流血的时候,机智至少会永远阻止他出国旅行。
但是,在Perestroika期间,发生了很多变化。 现在,任何人都可以说什么-基本上,任何人都不再对此感兴趣。 听到一个挑衅性的问题之后,航空公司的员工笑了:“他们会带你去那里。”
斯捷潘·帕基科夫(Stepan Pachikov)有充分的理由振奋精神,与空姐开玩笑。 “段落”中的内容进行得很顺利。
国际地位,新技术,美国合作伙伴斯科特·克洛索斯基(Scott Klososki)的货币,加上科学院的支持以及企业创始人不懈的精力-所有这些使得吸引新的开发商进行合作成为可能。
苏联唯一的“ espe”软件没有销售是什么意思。 还有一个实用程序,用于将扫描的图像粘贴到功能完善的办公套件中。 还有一个预测美国大选结果的程序。 和国际象棋数据库。 并进行了心理自省。 以及用于教授俄语作为外语的程序。 和他自己组成的一些电脑游戏。 还有一本电子计算机杂志...
有些事态发展是在没有Pachikov参与的情况下诞生的-espe只是将其出售。 但是随着业务的发展,越来越多的程序在“段落”的屋顶下浮现出来。 从无主意到最终成品,“段落”中确实做出了一些决定。
但是,尽管这些开发使将高级程序员和科学家拖入段网络成为可能,但大多数并没有带来多少收益。
企业的财务状况仅取决于三种产品-Chizhov的破解,Veselov的办公套件以及在Andrey Skaldin的指导下在“ Paragraph”中开发的一系列俄罗斯字体(后来他将自己分开,创建了“ Paratype”-最著名的字体局之一)。
新的身份帮助Paragraph建立了向各种政府机构或多或少定期销售程序的功能。 此外,该团队还了解了产品营销的基础知识,将一组完全不同的解决方案组合到了软件包中。
帕奇科夫(Pachikov)的手写识别思想使人们更加乐观。
在不知不觉中,“段落”的参与者承担了人工智能领域最困难的任务之一。 那时,世界上没有人试图识别连续的手写文本。 在这个领域工作的其他团队的野心不仅仅在于识别印刷的信件-或手写的信件,而且是分开的。
“段落”中没有人知道科学家谢利·胡伯曼(Sheli Huberman)的计算是否合理,后者在70年代发表的一篇理论文章中提出了承认原则。 但是,他的学生Leonid Kuznetsov和Grigory Dziube仅仅花了几个月的时间就制作出了该识别器的原型。
该程序将每个字母分为单独的元素-圆圈,棍子,循环。 为了简单起见,并且在没有更合适的术语的情况下,“段落”中的这些元素开始被称为hrenyatins(在数学语言中,它们被称为XR元素)。
原型使用了八种辣根,作者设法用它们描述了俄罗斯字母的所有33个字母。
该算法考虑到每个元素的顺序,计算出每个元素与一个或另一个婴儿床的相似度。 结果是出现了一些更可能的辣根。
然后,程序将这些序列中的每个序列与在“参考”护士集中描述的理想字母库进行比较。 结果,选择了最相似的选项,此后识别器进入下一个字母-下一组辣根。
令开发人员自己大吃一惊的是,该程序有时会相当合理地识别出各个单词-事实是只有它们是由程序的作者自己编写的。 识别器一遇到外人写的字,就发出了咒语。
在科学院信息传输问题研究所工作的Ilya Losev从事与机器智能有关的基础科学研究,他参与了该程序的改进。
Losev建议通过教他比较不同长度的小鱼集来完善算法-毕竟,最好的三个小鱼集可能比五个最好的小鱼集更“糟糕”(也就是说,与标准的相似性较差)。 此外,使用斜体,字母的某些元素可能看起来几乎不可读,这意味着识别器应该能够“猜测”未书写的废话的存在。
实际上,这是通过“通过”来实现的,算法为此支付了“罚款”。 同时,有时甚至由五名护士组成的一组甚至比一组四名经过精确识别的护士得分更高的“点”,即使他们被录取了罚款。
另一个重要步骤是连接字典。 为了提高识别的准确性,该算法开始检查哪些字母可以跟在已识别的字母之后-这大大减少了选项的数量。
当然,采用这种方法时,很大程度上取决于首字母识别的准确性-因此,为此,算法要经历几个选项及其分支。
最终,随着我们对该程序的研究,很明显八只公鸡是不够的-他们开始增加新的。 很快,分数上升到几十...
随着每一步,算法变得越来越复杂。 为了将其转换为代码,该项目引入了一个年轻但才华横溢的程序员Alexander Pashintsev,他在儿童计算机俱乐部成立之初就与该公司的创始人会面。
因此,从事识别器工作的团队的骨干是:Huberman,Kuznetsov,Dziuba,Losev,Pashintsev ...
如果公司遵循其最初的想法并尝试创建儿童教育计划,那么他们的所有成就显然都是徒劳的。 然而,帕奇科夫很快意识到这个想法脱离了现实,并且不会消失。
幸运的是,与此同时,他发现识别技术本身具有良好的商业潜力。
一次,在计算机俱乐部的帮助下,帕奇科夫结识了美国新闻工作者埃斯特·戴森(Esther Dyson),他是技术通讯1.0版的作者,也是为开发人员举办的流行会议的组织者。
埃斯特(Esther)密切注视着政治结构发生转变而导致东欧计算机行业发生的变化。 她甚至亲自来到莫斯科,用自己的眼睛看一切。
当然,戴森无法避免访问帕奇科夫(Pachikov)开张的苏联首都唯一的儿童计算机俱乐部。 熟人开始了,俱乐部主任成立了自己的软件公司时,埃丝特(Esther)邀请他在布达佩斯的东西方高科技论坛上发言。
帕基科夫顺应潮流,阅读西方计算机杂志,但只有在这次会议上,他才意识到自己已经忽略了最重要的一件事。
在舞台上,在场外,每个人都只是在讲一个新时代,即将到来的是笔式计算机的出现-用电子笔代替键盘的计算机。
热心者相信,通过使计算机更像普通笔记本电脑,从而使普通人更容易理解,他们将彻底改变市场。
在发明触摸屏和iPhone之前,还有15年以上的历史。 当时,人们认为理想的便携式计算机需要一种输入接口,该接口应结合模拟和数字两种数据类型的优点。
在模拟用户中,输入信息(即像在普通笔记本中一样用手书写)会更方便,但是成熟的计算机应该能够以数字形式存储和处理输入的信息。
问题是,到目前为止,还没有解决方案可以识别人为涂鸦并将其转换为计算机可读符号。
正是基于这样的决定,仍然鲜为人知的苏联公司Paragraph得以运作。
也就是说,基于完全错误的假设,Stepan Pachikov和团队本身并不知道,而是着手创建一种可能成为新的数十亿美元产业的关键的技术。
在现代成功地图册中,运气仍然是有争议的领域。 有些人完全否认运气和爱心引用美国创始国之一托马斯·杰斐逊(Thomas Jefferson)的话:“工作越多,我就越幸运。”
其他谦虚的思想家会给自己带来好运-就像每一个耕low一生但从未成为百万富翁的人一样。 美国国会议员弗兰克·克拉克(Frank Clark)说:“很难认出运气-通常情况下,运气看起来完全像您应得的。
斯蒂芬·帕基科夫(Stepan Pachikov)可能会认为自己很幸运,仅仅是因为他有机会在苏联做生意-该段落合资企业的诞生,不仅要归功于它的能量,而且还要归功于命运。 看来,财富并不会离开她的新宠儿。
1990年3月,Pachikov,Chizhov,Losev,Skaldin段落代表团前往汉诺威参加大型贸易展览会“ Cebit”,宣布自己的身份并展示其整个软件产品线,包括原型识别器。
机会一出现,苏联启动团队便开始征服西方世界。 但是事实证明,她是在正确的时间出国的,只能选择。
执掌五年的米哈伊尔·戈尔巴乔夫(Mikhail Gorbachev)的苏联外交政策转至一百八十度。
与西方的冷战正式结束。 苏军从阿富汗撤出。 柏林墙被毁。 华沙街区被解散,东欧国家有权选择自己的道路而不必回头看莫斯科。
当然,苏联从危险而险恶的敌人变成宽宏大量,尽管是异国情调且有些天真的朋友的转变被西方世界大为接受。 所有苏维埃事物引起了人们的好奇心。 西方许多人惊讶地发现,他们也生活在共产党的国家中,其中有些人很正常。
段落小组毫不客气地利用了这种兴趣。 在展台上,他们打扮成囚犯或建筑营的士兵,身着缝的外套,被苏联军队腰带束缚,胸章上有星星。
后来,帕奇科夫会说他为他们的举止感到羞耻-如果他比较聪明,他将不会允许这种欺骗手段。 但是,看来,那时文明世界中的苏联大使已经准备好原谅这种情况。
在展览会上工作之后,段落团队租了一辆小型货车,出发去德国旅行,亲眼目睹了陌生,自由的世界。
到达柏林后,我们去了废墟墙上收集石头。 搬到西部地区,我们整夜走到那里-与仍然兴高采烈的当地居民一起,庆祝即将到来的德国统一。
随着娱乐变得更加猖ramp,脚下堆满了垃圾-纸,瓶子,烟头……一大早,柏林人行道上出现了清洗机,这迅速消除了夜间郊游的所有后果。
对于苏联公民来说,一方面是自由与秩序的结合给人留下了深刻的印象。 苏联的居民习惯于采用这种方式:生活中有一个或另一个。
第一次在欧洲露面已经很多了。 但是很明显,为了实现真正的突破,Paragraph必须前往美国,最大的计算机公司在那里工作。
而现在,经过几个月(1990年6月),Paragraph代表团登陆美国,在最大的国际计算机展览会Comdex上展示了识别器的beta版本。
在美国,由于冷战结束而引起的欣喜不亚于欧洲。 就在Komdeks不久之前,米哈伊尔·戈尔巴乔夫(Mikhail Gorbachev)首次访问美国。 这位苏联总统正处于其全球知名度的顶峰-距离获得诺贝尔奖仅一步之遥。
同时,美国企业正迈出第一步,开发一个新的,未知但有趣的市场-那时,第一家麦当劳已经在莫斯科开业。
对于巨无霸和薯条,苏联公民排队等候许多小时,以尝试在前潜在对手的国家发明的古怪菜肴。
然而,尽管冷战正式结束了,但人们应该对此保持警惕:在莫斯科的Paragraph团队开始销售软件并弄乱他们的猎犬时,Scott Klososki公司的美国联合创始人不得不与俄克拉荷马州联邦调查局交谈。
有一次,两名特工赶到企业家办公室,并要求与他们一起开车。 他们开车把他送到汽车旅馆,把他带到他的房间,在桌子旁坐下。 其中一名特工在桌子上放了一把枪-或者使坐起来更舒服,或者使对话者了解他的处境的严重性。
此后,他们开始向他询问苏联之行的情况以及与共产党的进一步合作。
尽管场面险恶,但斯科特并不十分害怕-他确信自己没有做任何违法的事情,因此甚至没有考虑过律师。 此外,他尚未受到任何指控。
完全相反,联邦调查局特工说他们想保护他。 谈话的一部分专门用于教育计划:如何与俄罗斯人打交道,以免惹上麻烦。
首先,应该避免与俄罗斯妇女的关系-不管这种多么不人道的禁令看起来多么复杂,令人难以忍受。 特工警告说,克格勃正是通过他们设法与他接触。
斯科特本人知道,在苏联,必须格外小心,因此他感谢他的建议。
经过数小时的审问后离开房间-与共产党合作期间不是最后一次-斯科特不仅摆脱了白天廉价汽车旅馆的阴霾,还从充满怀疑和敌意的世界回到了一个新的,尽管是虚幻的世界,但却是如此动人的国际合作世界。
在“驼背”之后,出现在“ Komdeks”上的第一家苏联计算机公司注定要成功。
当他们到达展览会时,段落团队就感受到了美国人的支持。 展位的所有设备均由送货服务发送,她丢失了。 结果,展台的设备被全世界组装了-许多美国人想帮助这家苏联公司。
幸运的是,对于演示所必需的程序本身,公司员工将个人行李放在软盘上。
许多人询问他们的段落识别技术是否可以用于用笔键入的文本。 帕基科夫回答说,理论上-是的,但实际上-尚未。
因为他们没有电子笔可以执行此操作。 数字笔不仅是一种昂贵的玩具,而且供不应求。
Paragraph在莫斯科拥有的只是一台手持扫描仪,该扫描仪由Logitech代表的计算机俱乐部的一位客人赠送。苏联程序员并没有要求任何回报,而是向他们赠送了一支钢笔。这份礼物的价值不能被高估:由于有了这份礼物,Paragraph现在可以继续使其技术适应新的有前途的市场。与扫描仪不同,笔的操作不是静态的,而是动态的。它包含有关手的及时运动的信息-从而可以更准确地识别辣根。记者们在Paragraph展位周围不停旋转-Comdex历史上第一个苏美合资企业就是展览的一项活动。甚至CNN新闻频道都要求接受采访。但是,这导致了合资伙伴之间的第一次分歧。斯科特安排了一切,以便摄制组在斯蒂芬不在时出现在展位。也许这是一个巧合,但是帕奇科夫建议他的同伴担心一个糟糕的英语伴侣。不能排除的是,他也受到完全可以理解的渴望的驱动,他渴望走在前列并利用这次机会来提升自己。当帕奇科夫回到段落展位时,电影摄制组已经在打包设备。“对不起,我们做完了,”记者礼貌地说,继续整理。斯蒂芬说:“是的,对不起,我只是想告诉计算机如何摧毁共产主义。”记者立即向同事发出拆包的信号。他们再次设置摄像机,照明灯并记录了对Pachikov的采访。斯捷潘发表了他的挚爱的演讲,即没有信息控制就不可能有专制主义,而个人计算机的普及使苏联政府失去了这种控制权。该段落的创建者从Perestroika的一开始就提倡这种想法。 1986年,他甚至写了一篇针对美国总统罗纳德·里根(Ronald Reagan)的文章,其中他呼吁取消对苏联供应设备的限制。帕奇科夫甚至试图在西方发表一篇文章,并通过一个经常来莫斯科的美国人朋友将其传到国外。然而,美国人与这封信一起花了700美元,以斯蒂芬的一位熟人的名义在美国开了一个帐户。苏联公民对西方银行体系的结构一无所知,因此认为这样做不会有任何困难。帕奇科夫不知道金钱和信件的命运。他再也没有见到这个美国人。关于里根,个人计算机和信息控制的演讲非常符合当前的新闻日程-在访问美国期间,戈尔巴乔夫能够让里根放松对苏联出口技术的限制。总体而言,CNN不仅在展览报告中提到“段落”,也没有给出一两个报价-电视频道发布了有关一家美苏公司的十分钟故事。此后,帕奇科夫认为斯科特还太年轻。他应该猜想,在这种情况下,向记者们隐藏苏联伙伴是不值得的。克洛索夫斯基本人向合伙人的营销创造力致敬-例如,他想到了在苏联纸币上盖章公司联系信息,并赠送卢布作为名片。在这种情况下,此举引人注目,引起了人们的注意。斯科特(Scott)对斯捷潘(Stepan)的英语的恐惧也是有道理的。在听了Klososki的采访后,Pachikov充满愤慨地问:“斯科特,为什么您总是称我们的设计为茶炊?” ...
最初,美国人不了解所面临的威胁。 “好吧,你总是说:茶炊技术,茶炊技术……”-斯蒂芬解释说。实际上,斯科特说过我们的某些技术-“我们的某些技术”。尽管存在沟通问题,但Scott和Stepan彼此都很满意,意识到他们的会面对于两位企业家都是巨大的成功。媒体关注,主要电视频道的采访,与有影响力的计算机公司的首次接触,以及美国本身的商店里装满了色彩缤纷的商品,快速发展的高速公路和完全不同的国籍的人-所有这些新的印象当然激发了不太成熟的苏维埃的想象力科学家。但是,下一步该怎么办,以及如何从谈论变成真实的合同-如何在这里开发和销售高智能产品呢?来自俄克拉荷马州的简单商人斯科特·克洛索斯基(Scott Klososki)和昨天苏联科学院的高级研究员斯蒂芬·帕基科夫(Stepan Pachikov)都不知道。段落小组尚未弄清所有这一切。硅谷的先驱。所有完成的章节:
第1章:“等等,”姆扎瓦纳泽说
第2章。 守望者科学家
第三章计算机人
第4章Beta
第5章“我们可以解决任何问题”
第6章狂野的东方
→第7章。
第8章。我是一只海象
第9章轨道中的电枢
第10章美国人
第11章语言D
获取所有章节并订阅新内容