
前言
仍然,我是一个梦想家,也是一个梦想家,实际上(在编程世界中)最大的是“车库里的家伙”,但是在
“松开螺母”之后,我无法抗拒将MCDM-Project和
玩具项目一起展示的想法特别
是测试版本 (如果有问题,我有点担心Habraefeffect,我们深表歉意)。 该项目网站的链接会在出版结束时(以及调查之后)等待读者阅读,建议您浏览该网站,理想情况下,您应该熟悉摘要中的主要思想。
为什么是非线性?
这个故事始于一系列出版物,主题是具有松散耦合(不明显联系)的参数的多标准对象评估,并与应该制定规则以评估所考虑对象的专家合作。 很快,很明显,与专家合作时不可能使用线性评估标准。 人以非累加的方式思考。 想象一下,您将要选择一台笔记本电脑(此示例应该非常接近Habr的公众),并考虑一些特定的选项(简化许多功能):让它成为频率为3 GHz,内存为8 GB的i5,以及第十系列的视频卡,其内存为4 GB 。 假定具有相同预算的购买可用替代方案如下:
- i5,频率为3GHz,内存为8GB,第10系列视频卡的内存为4GB;
- i5的频率为3.5 GHz,4 GB的RAM和带有4GB内存的第十系列视频卡;
- i5的频率为2.5 GHz,8 GB的RAM和带有6 GB内存的第十系列视频卡;
- i5,频率为3.5 GHz,8 GB RAM和带有2GB内存的第十系列视频卡。
请注意,在此示例中,所有参数值都呈线性变化(相对于参考选项,将一个参数的值减少/增加一个常数会导致另一个参数增加/减少一个常数)。 但这是否意味着您的偏好保持不变? 一点都不! 您可以随时打折以表明自己是最喜欢的选择,这意味着它的评级比其他评级更高。 继续这种思想,让我们用这个例子证明,用于评估替代方案的线性偏好标准也不适合。 假设情况并非如此。 举例来说,我们将选择一台用于工作的笔记本电脑(即,我们不希望玩游戏,但是对于计算,我们对性能和RAM感兴趣)。 我们将引入一个新选项:频率为3.5 GHz的i5、16 GB的RAM和具有0 GB内存的视频卡。 我们区分三种选择(保留编号以便于理解):
2)i5,频率为3.5 GHz,RAM为4 GB,第10系列视频卡具有4GB内存;
4)i5,频率为3.5 GHz,RAM为8 GB,第10系列视频卡具有2GB内存;
5)i5的频率为3.5 GHz,具有16 GB的RAM和具有0 GB内存的视频卡。
考虑到我们的偏爱,第五名显然是最好的选择。 线性评估标准的使用假定参数值单位的贡献与标准值线性相关(例如,参数增加一个导致标准值增加其他单位)。 在这种情况下,第4个替代方案的条件是X差,而第2个替代方案的条件应是2倍(我们未考虑视频卡)。 但是下班后我们是否应该玩不太苛刻的游戏-我们应该选择哪个选项? 在这里,我不同意,但大多数人会令人信服地选择第4号替代品。 问题是,专家的判断考虑到了参数对替代质量的共同贡献的隐式关系。 因此,对于我们的选择规则,处理器频率和RAM数量的共同意义比RAM数量和视频内存的共同意义更为重要。
在选择参数超过3个的情况下,还需要专家评估参数对的影响,不仅要评估参数对的影响,而且还要评估参数的三倍等等,这不仅表征了这种搜索设置对首选替代方案的灵活性,而且还表征了此过程的复杂性专家(复杂规则的形成)。
在本文发布时,在我们的测试版本中,只有基本功能,也不允许灵活配置选择规则。 到目前为止,它受复杂程度的限制(有条件的为1m),在将来将其称为“简单规则”。 值得注意的是,简单的规则已经比任何(众所周知的)现有目录提供了更多的便利。 要么我们不知道要在目录中找到什么,然后我们被迫逐字逐字地浏览目录(使用的排序传统上很简单-按价格,新颖程度等),寻找我们喜欢的东西,或者我们我们非常了解要查找的内容,然后使用filter =极大地缩小了搜索范围,冒着丢失有趣的选项的风险,这些选项并没有超出搜索范围,但是对于我们来说可能是有趣的,或者是造成了一些令人讨厌的点击,突然意识到目录无法执行任何操作 提供给我们。 后者要简单一些-许多目录显示应用过滤器时的选项数量。
我们提供了一种将复杂的排序和范围过滤器相结合的方法。 对于目录站点,这意味着通过外部附加组件来补充现有功能,该附加组件会照顾用户的喜好(选择规则的形成,成功规则的存储和使用)。 将来计划开发“所有功能”选项,可能是基于新原理的DBMS,但是我们将不在本文中讨论。
从评分到评分
多因素排序的出现是由于以下事实:用户(专家)形成的选择规则可以“汇总”为数学非线性函数。 这意味着借助于这种功能,可以对目录的每个元素进行评估(目录的每个元素都分配了与用户偏好的对应程度)。 一方面,这意味着原则上可以根据用户的喜好对整个目录进行排序(即,最优先选择第一项)。 这极大地简化了用户的生活,并且应该对增加对这种目录站点的兴趣产生积极的影响。 另一方面,这会给排序本身带来额外的开销,不允许部分选择10-20-50或每页其他元素。 在这里,我们对现有的DBMS毫无疑问。 历史上已经发生了这种情况-需要尽快“消除”用户对DBMS的“逐段”请求的轴(以便用户不必等待太多)。 但是,让我们考虑一下:不是不是因为请求太多,而无法使用现有接口找到我们想要的东西吗? 减轻服务器端负担的愿望不是使我们(用户)越来越戳吗? 我们提出了大量无用的请求,但是对此我们应该负责...我们提供了使用户能够提出复杂的请求并诚实地警告他们必须等待的方法。 也许这将特别适合您:更少的点击次数和更多的感觉=节省搜索能量,将它们用于选项分析等。
为了演示所提出的方法是如何工作的,需要沉浸在实践中。 典型的实际问题是:购房问题,购车问题等。 它们的特点是数量众多(约几千个),而基本参数(通常是弱互连的选择参数)的数量相对较少(通常是五到十个)。 在本文中,我们将依靠购房问题。
房地产目录很多,我们在2018年中使用了著名的房地产目录(无法确定其名称在此处-项目链接位于项目网站上),并在此基础上形成了St.的有条件的待售广告公寓(二级市场)目录。彼得斯堡。 在这里,可以放置以下内容:解析器的编写方式,如何“浏览”机器中的目录页面,下载它们,提取广告数据以及他们在组装条件目录时遇到的困难,但是,在我们看来,这种材料对于从文章的角度看,Habr和并不代表特殊兴趣。 我们只注意到,有条件的目录形成后一个月就要从源目录下载图像,因为到那时为止,很多广告已被删除(出售/删除/ ...),这意味着条件目录的许多声明现在都没有缩略图。 (这一点都不重要,但是有点烦人)。
在干渣中
今天,我们准备以购房问题为例,展示具有基本排序功能的Alpha测试版本。 值得注意的是所提供功能的主要功能:
- 排序是在客户端(浏览器)上实现的。
- 排序功能的远程形成无需访问目录即可进行。 仅需要有关已排序对象的参数的可能值范围的一般信息。
- sorting函数是一个匿名JS函数(由字符串“ on the fly”组成的极少数情况)。
- 对WHOLE目录进行排序时,假设每个目录项的匿名功能(第3节)都可以“运行”(通过重载内置排序功能来实现)。
在项目网站上进行的交互式游览将最好地告诉您如何使用建议的功能。
立即计划和前景
在进行Alpha测试版本(购房问题)的同时,还收集了有条件的笔记本电脑。 与基本示例相比,可能的参数数量超出了图表! 此外,发现了问题(在某些地方是预期的)。 首先是笔记本电脑中存在大量组件,因此适合组织一些嵌套评估。 这是由于以下事实:处理器,视频卡和其他关键组件很难相互比较(这是一个单独的问题),并且如果您将组件参数保持在笔记本电脑参数的级别,它们的数量将会太大,并且用户(专家)建立适当的选择规则将极其困难。 第二个问题是,许多参数从根本上来说是数字的(例如,单个组件的制造商,在其中实现的技术等,更不用说组装国家和其他形式不正确的信息)。
在以后的出版物中,计划更详细地介绍创建具有交互式测试功能的COMPLEX选择规则的过程,计划形成COMPLEX规则的新测试版本和/或引入笔记本电脑的有条件目录作为复杂示例的过程,并在项目的进一步开发中考虑您的反馈意见。 感谢您的关注! 欢迎对构想和项目的测试(演示)版本进行PS的建设性批评:)
UPD :服务器似乎很虚弱,如果有人遇到“连接错误”,请稍后再试(建议刷新页面)...
参考文献
项目站点:
mcdm-project.org相关出版物:
- Pavlov,《半结构化问题研究中的多准则决策技术》 / AN Pavlov,DA Pavlov,AA Pavlov,AA Slin'ko //第六届计算机科学在线会议2017年会议记录(CSOC2017) 。 2017年4月。-瑞士施普林格国际出版公司2017年,第2卷:智能系统中的控制论和数学应用。 第131-140页。 DOI 10.1007 / 978-3-319-57264-2_13
- 帕夫洛夫(美国) 基于知识表示和实验计划模型的管理决策的多准则选择组合方法 帕夫洛夫(A.A.) 帕夫洛夫(D.A.) 帕夫洛夫(A.A.) Slinko //“ A.F.的议事录 莫扎伊斯基。” -SPb :: VKA他们。 莫扎伊斯基(A.F. Mozhaysky),2017年-期 656.-C. 9-17
- 帕夫洛夫(Pavlov AN),《通用船舶系统功能要素失效关键性的多准则分析方法和技术》。 帕夫洛夫 D.A.库拉科夫 帕夫洛夫//第二届国际科学与实践会议“海洋工程和海洋运输系统的仿真与集成建模”(PCM MTMTS 2013),2013年7月3日,圣彼得堡:会议记录/ OJSC“造船与修船技术中心”-圣彼得堡,2013,S。78-85
- 帕夫洛夫(Pavlov A.N.) 多准则分析单个元素对复杂系统性能的影响//管理信息系统。 -2010,No.6(49),S.7-12
- 帕夫洛夫(Pavlov A.N.),对复杂对象元素失效的严重程度进行多标准分析的组合方法/ 帕夫洛夫(弗吉尼亚州) 泽伦佐夫(E.A.) Kopytov,//第十届“运输和通信中的可靠性和统计”国际会议(RelStat'10),2010年10月20-23日,拉脱维亚里加,ISBN 978-9984-818-34-4-里加:运输和电信研究所,p。 353-360