俗话说:“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。所谓类,通俗地说,就是指相似元素的集合。
聚类是一种无监督的学习,他将相似的对象归到一个簇中,将不相似的对象归到不同簇中。聚类分析起源于分类学,在古老的分类学中,人们主要依靠经验和专业知识来实现分类,很少利用数学工具进行定量的分类。随着人类科学技术的发展,对分类的要求越来越高,以致有时仅凭经验和专业知识难以确切地进行分类,于是人们逐渐地把数学工具引用到了分类学中,形成了数值分类学,之后又将多元分析的技术引入到数值分类学形成了聚类分析。
用一个同学们生活中最常遇到的问题来举例子,在考试后学校通常会以考试的成绩作为学生划分的标准。比如满分为100分的试卷,A类90分以上,B类80分以上,C类60分以上,D类60分以下,以此为标准分为4类。这种方式虽然简单易行,又有统一的标准,但存在一些缺陷,比如学生总体成绩因为某些因素导致偏低,再按照这种方法进行评价得到的结果就不太科学,也不能有效评价教师的教学成果。那有没有更科学的办法对成绩进行分类呢?
K-means 有一个著名的解释
牧师—村民模型:
有四个牧师去郊区布道,一开始牧师们随意选了几个布道点,并且把这几个布道点的情况公告给了郊区所有的村民,于是每个村民到离自己家最近的布道点去听课。
听课之后,大家觉得距离太远了,于是每个牧师统计了一下自己的课上所有的村民的地址,搬到了所有地址的中心地带,并且在海报上更新了自己的布道点的位置。
牧师每一次移动不可能离所有人都更近,有的人发现A牧师移动以后自己还不如去B牧师处听课更近,于是每个村民又去了离自己最近的布道点……
就这样,牧师每个礼拜更新自己的位置,村民根据自己的情况选择布道点,最终稳定了下来。
2. 连线:可以通过 ev3.screen.draw_line(x1,y1,x2,y2)进行连线,因为是一维数据所以y值可以为固定值,中心的y值与学生成绩的y可以不同,使聚类的效果在EV3屏幕上能更直观的展示出来。同时将连接到同一个中心的值存入一个新的list。


P.s"整形医生":金星宇


还有一个多星期就过年啦,在这里提前祝大家新年快乐!
愿今朝所憾皆为翌日之喜。
因为疫情原因暂时无法相见的孩儿们,我们年后再见,希望再见面时不要变成“无忌”。
Respect everyone!



