关于过程的一句话,否则我们都有些避孕 。关于自然和人工(AI)思想的继续思考,第一部分在这里回填问题 :现在有人居住吗? 不是当我们沿着街道行走并直接考虑周围的世界时,我们或多或少地
实时采取行动。尽管实际上-到目前为止,我们所看到的将通过通常的识别/分类机制进行-所有这些都是最近的,但仍然是过去的。 即 一个人过去生活吗?
例如:您在街上漫步,看到一条狗。 或汽车。 无论如何,如果我们正在谈论此刻,则此信息已经过时了。 如果我们处理的数据已经遍及我们所有的认知机制(并且大脑距离最快的计算器还很远!),我们将无法与世界保持同步! 狗会发动攻击,反之亦然-它会逃跑,而您想要在耳后轻拍它的愿望将无法实现,尽管您想赶上这辆特定的汽车,但汽车会撞倒您或让您经过。
但是感谢上帝不会这样发生,这就是为什么:大脑的工作方式不同。 感知的单位不是对象,甚至不是对象的整体,而是过程。 狗在跑。 给你还是来自你。 或例如不运行,而是说谎。 轿厢也处于静止状态(在停车场中),或朝某个方向移动。 在所有情况下,您都认为过程是很长一段时间的,因此,将来会有一定的发展。 当我说我们感觉到事件在不断发展时,这不是比喻。 进行实验-拍摄十几张照片(即即时投射的现实)并描述您看到的内容。 这里有几个人在房间里,他们在吵架,或者这里一个人正沿着街道走,或者这里他正坐着-看电视,他正在读书。 这些都是耗时的过程! 您将即时转换视为具有长度的内容。 您不知道如何以不同的方式进行操作,因为大脑的工作原理是这样的:训练它可以识别过程,而不是舞台上分散的物体。 就像不是一个眼睛的鼻子,而是一个复杂的面孔(你好,卷积神经网络)一样。
世界是由过程而不是对象组成的。 如果您问
苹果是什么,大多数成年人会说它是一种
水果 ,而孩子们会说它是
食物 。 但是,这两个都是过程描述,因为第一个意思是这个苹果
在树上生长并服务于树的繁殖,第二个意思是
可食用 。 苹果与苹果的直接标志(形状,颜色,大小)均不相关。因为这些标志允许您识别但不允许使用,或了解其在世界上的使用位置,即 准确确定过程。
如果我们就时间的性质进行一次典型的辩论,那么经典的假设将是过去的不变性(在时间旅行的背景之外),现在的重要性(只有一刻......;))以及尚未存在的未来,这意味着可以改变。 当我们谈论客观现实时,很可能是这样。 但是,一个人生活在他自己的世界主观模型中,几乎一切相反!
过去远非我们所希望的不变。 人们不断地接收新的信息,以重建过去,以消除矛盾(
您以为Pyotr Stepanych在一次座谈会上就离开了脱衣舞俱乐部……这意味着他无处不在,他的演艺人员一般都不会去 )。 同时,您的主观未来在许多方面都是不变的(
不管是什么,但是星期五我有啤酒和足球! )。 不仅如此,在未来有明确的目标时,您不仅会以相反的顺序构建流程链(
要成为大公司的董事,您需要从一所享有盛誉的大学毕业并获得文凭,为此您必须首先进入该课程,为此您需要通过统一州考试,指导进军课! ),但很有可能-可以回去(
我们现在没有朋友/熟人,他们之间已经有了长足的联系,可以帮助孩子上大学 )-这不是什么玩意儿? ;)
但是,我有点分心。 不过,我要重点关注的主要是
流程 。 我深信,不需要在照片或视频中训练潜在的AI。 卷积网络有两个级别(最低级别)-实际上这是两个不同的网络:一个受过训练以在原始图片中找到某些图形模式,第二个处理第一个的输出-即 与已经处理和准备好的信息。 为了与AI世界成功交互,您需要做一件事:在某个(远非第一)级别上,必须有一个网络,该网络接收时间部署的进程图。 网络应该学习使用“开始”和“结束”,“运动”,“转换”,“合并”和“分离”的概念。
我非常确定,那些参与AI游戏的人(例如Alpha Go)会以一种或另一种方式理解。 也许那里的方法有些不同,但本质是相同的:分析董事会当前的状况(以及最后几步的进展),以分析“正在发生的一切”。 根据发生的情况与应该发生的情况相对应,选择您自己的举动。
当输入图像来自传感器时,很难谈论策略/行为。 反之亦然-实践证明,一个准备好的向量包含游戏中该领域当前状态的完整排列以及完整的信息(包括整个世界的图片)是可行的任务。 但是,如果第一级的卷积网络识别了对象,而下一级的动态分析了这些对象,则识别过程(例如熟悉训练)补充了先前获得的数据,那么似乎可以使用此方法...
给专家的问题:鉴于神经网络的最新发展,做这样的事情是多么现实:
在输入处 ,例如,连续的视频信号,可能是立体声。 作为一种选择:具有多个自由度(可以随意旋转相机或根据方案旋转相机的功能)。 但是,如有必要,可以用其他任何空间感知方法(从声纳到激光雷达)来补充/替换视频信号。
严格来说...输入时可以有任何实时流-至少是语音/文本,至少是货币报价,但是...在考虑的过程中,我更容易依靠我自己可以直接学习的唯一原因样本-我自己! )在这个“样本”中,感觉通道是无与伦比的!
输出:- 深度图(如果摄像机是静态的)或环境图。 空间(动态相机/激光雷达等);
为了什么如果我们要对对象进行真实的空间排列以评估它们的交互作用,则很有必要。 在这种情况下,来自摄像机的图像只是较大空间的二维投影,并且需要其他变换。
- 选择单个对象(考虑到深度/空间贴图,不仅考虑/不考虑可见轮廓);
- 突出显示移动物体(速度/加速度,绘制/预测轨迹(?));
- 根据任何可恢复的属性(形状/尺寸/颜色/运动细微差别/组件(?))对对象进行分层分类。 即 实质上检索希尔伯特空间的度量。
关于等级在这种情况下,“分层”一词可能并不完全合适。 我想强调一点是,可以随时选择度量,以便它们之间的
海明距离使我们可以将两组不同的度量视为一个概念。 例如,应将“红色汽车”和“蓝色公共汽车”等概括为“车辆”的概念。
重要提示:如果可能,系统未经过预训练。 即 可以放置一些基本的东西(例如,第一层的卷积网络以突出轮廓/几何形状),但是您必须学会选择对象,然后自己识别它们。
- 最后,及时构建扫描(基于第1.4段,即考虑到度量的空间图)(目前,在此阶段,可以直接观察到周期),目的是分析2-4,s为了识别:流程/事件(本质上是第3节中的时间变化 )及其集群分类(第4节)。
再次:从传感器的图像中,我们首先以更加准备好的形式提取对世界的描述,并根据可恢复的属性进行标记,而不是将像素划分为对象。 然后,我们扩展由时间组成的世界,然后将生成的“世界图片”提交给下一个网络的输入,该网络的工作方式与之前使用触摸图片的各层一样。 在物体轮廓突出的地方,现在将区分正在进行的过程的“轮廓”。 物体在空间中的相对位置类似于过程在时间上的因果关系。
大概在此之后,系统应该能够按照它们的部分来识别过程(能够识别图像,仅包含它们的一部分,或者
在模型上书写文本的延续 ),并因此能够在时间上向前和向后预测它们,从而扩展模型条款5在两个方向上均不受限制。 而且,大概可以对复合过程有所了解,该系统可以揭示更广泛的全局过程,结果是隐式,隐藏的过程,这些过程是已识别的全局过程的一部分,但未被几个相关的本地过程直接感知。
好,最后:在将来拥有固定的系统状态(只有希尔伯特度量标准的重要元素是固定的,其余部分可以自由解释,而不是重要值)-网络是否能够“猜测”其余部分?
好吧 如果是只指定了两个不相关片段的图像-在某个样本上训练的网络能否完成“一致”的完整图像? 在这种情况下,样本与实验的时间间隔相同,碎片是当前状态和给定状态。 结果:链接彼此的一致“故事” ...
在我看来,这已经成为进一步实验的非常坚实的基础:
- 如果可能/必要,将自己的行为包含在“历史”中
- “常规”因果模式的优先级高于不受控制的随机排放(轮盘问题)
- 某种好奇心,即 通过行动...等主动学习模式
PS:我完全承认我只是发明了一辆自行车,有学识的人长期以来一直在实践中运用这些原则。 ;)在这种情况下,我要求您在适当的开发中“戳鼻子”。 如果对这种方法的基本问题有详细的描述,或者证明其原理上不起作用的理由,那将是绝对美妙的。
PPS我知道文本很粗糙,想法从一个跳到另一个,但是我真的很想问几个人这些问题(“专家问”一节),而没有至少一些介绍很难做到这一点。
先前的文本 (并且我现在正在重新阅读,并且意识到很难理解)完成了其任务:我收到了对我来说很有价值的几次讨论……我希望这次也是! ;)
UPD:尽管有一些缺点,但讨论仍在进行中,对此我感到非常高兴!
UPD2:由不同的人在不同的时间给出的主题链接列表,或者是我自己发现的:
- 关于细分,受欢迎: 千...
- 如果通过立体视觉得到加强? 一 , 二 ,说三 ...
- 这就是所有没有神经元的纯数学OpenCV。 您可以将其组合起来 , 等等 ...到目前为止。
- 如果根据前面提到的对象的方法集选择了对象,那么将来可能会形成一组用于跟踪它的标志...
- 如果有出色的强化学习,为什么还需要寻找其他方法?
- 一个经过预先训练的网络,可以突出显示视频上的操作 ...很难说这在我们的案例中的适用性,但这很有趣!