机器学习模型设计过程和MEMS MLC
2021-12-15
来源:CTIMES
开发机器学习项目的五个步骤 — 掌握要点,应用并不困难!
边缘机器学习具有许多优势。 然而,由于开发方法与标准程序设计方法截然不同,许多机器学习开发者可能会担心自己难以驾驭。
其实,完全没有必要担心。一旦熟悉了步骤,并掌握了机器学习项目的要点,就能够开发具有价值的机器学习应用。此外,意法半导体(STMicroelectronics;ST)提供解决方案,以促进边缘机器学习得到广泛应用发挥全部潜力。本文描述机器学习项目的必要开发步骤,并介绍了ST MEMS传感器内嵌机器学习核心(MLC)的优势。
图一 : 嵌入式ST传感器的机器学习核心
首先,针对机器学习模型--判定树(Decision Tree),该模型与MLC一起内嵌在ST MEMS中。
当用户想要在嵌入式系统中使用机器学习或深度学习功能时,通常可按照以下五个步骤进行开发(图二)。
图二 : AI项目开发的五个步骤
在步骤1中,开发者需要收集机器学习所需的数据。该数据集的一部分(训练集)将用于训练模型,另一部分(测试集)将用于评估所构建模型的性能。机器学习的数据集中典型的拆分比率为:训练集80%,测试集20%。
在步骤2中,需要对数据进行标注。开发者需要将收集到的数据标注类别(例如「跑步」、「散步」、「静止」等);而判定树是一种基于开发者所决定的分类模型。
分类则是指根据重要的属性对数据进行分类:这种属性在机器学习领域被称为「类别」。
接下来,在步骤3中,使用预先准备的数据集训练机器学习模型。该任务亦称为「fitting」。训练结果的准确性在很大程度上取决于训练集的内容和数量。
在步骤4,将训练过的机器学习模型嵌入到系统中。用户可以利用Pythonlibrary直接运行模型。 对于在MCU等组件上运行的机器学习算法,开发者可以在执行之前将该library转换为C程序。 而针对MEMS MLC等硬件连接型解决方案,开发者可以在执行之前使用专用软件UNICO-GUI将library转换为register setting。
最后步骤5,验证机器学习模型。 如果验证结果与预期的结果不能匹配,则开发者必须审视上述步骤中需要改进的部分,以及如何改进。
模拟人类在进行分类的思维方式-判定树
在机器学习兴起之前,判定树模型就已经用于数据分类。例如杂志上的性格测试 - 在测试中,您需要依照顺序回答多个问题(顺序是依照每个问题的分支而决定的),之后再根据结果推断测试者的性格。这是一个典型的判定树范例。为了创造一个机器学习分类模型,需要在每个阶段组合多个检查点(称为decision node)。
在另一个例子中,一位经验丰富的房地产经纪人评估来访客户是否会根据如下图所示的判定树购买房产:他将到达一个最终节点(或称leaf),并根据每个node的条件做出最终决定。
图三 : 判定树范例(以房地产业者为例)
在开发判定树之前,必须通过分类算法确定三个要点,即要解决的问题、分类过程中感兴趣的参数(特征值,即input),以及要寻找的最终答案(即output)。 在房地产经纪人的例子中,问题是预测客户是否会购买房产。 答案是客户是否会购买房产。
总之,特征处理是获得准确答案的关键。 在这种情况下,特征可以包括客户的收入、房产的价格、房间的数量,以及是否有停车位等等。得到的答案很大程度上取决于特征值、特征的顺序,以及分类阈值(用于区分数据的thresholds)。为了创造机器学习判定树,开发者必须先定义需要的特征和阈值。接着可以透过反复学习来改善判定树的结构以获得更准确的答案,进而优化每个node的特征选择顺序和分类阈值。
判定树方法看起来像是传统的「if-then-else」方法,那不同之处在哪呢?
关键在于所使用的特征、决策节点的位置、阈值和判定树的结构不是由设计人员事先决定的,而是模型根据数据集学习而来。 事实上,若依据米兰、东京或上海的房地产数据集训练模型(例如,房地产模型)时,可能会得到不同的结果。
走过AI边缘装置的过渡期-在内建MLC的ST MEMS传感器上运行嵌入式判定树。
ST提供了LSM6DSOX、LSM6DSO32X、LSM6DSRX和ISM330DHCX(这些装置将MEMS传感器与3轴加速度计、3轴陀螺仪和MLC整合),以及IIS2ICLX(整合了超高精度2轴加速度传感器和MLC)。
因应机器学习分类的需求,我们进行了硬件逻辑优化且具备出色的传感器规格(图三),内建MLC的MEMS动作传感器为使用者提供具有低功耗和较高实时精度的个人化嵌入式判定树(图三)。 MLC可以执行高达32个特征值的判定树。 意法半导体也提供了开发环境,以便开发者轻松开发在MLC中运行的判定树。
开发者可以在机器学习常用平台(如Weka、RapidMiner、MATLAB和Python(图四))上进行开发。 尽管这些平台相当灵活且多功能,开发者仍需具备足够的知识和技能才能妥善开发适合该应用的判定树。
图四 : MEMS MCL训练流程
为此,意法半导体针对ST MEMS传感器开发板提供了Unico-GUI软件,其中包含多种特征,便于轻松开发判定树并载入至MLC。 Unico-GUI用户能够轻松、直观地收集数据,并透过简单易用的GUI来训练、验证模型。
意法半导体推出高度通用、配备多种传感器的开发板,可满足广泛的硬件规格需求(图5)。 开发板配备支持MLC的MEMS动作传感器,并具有支持无线连接、可由电池供电、可在SD卡上存储数据等特点,具有高度通用性,可用于广泛的应用(包括汽车、工业用仪表和消费性电子装置)。 意法半导体更提供AlgoBuilderSuite PC软件,该软件(搭配使用Unicleo)提供GUI,可以轻松在开发板上操作,并进行数据搜集。 有了AlgoBuilderSuite,开发者可以轻松、直观地对传感器进行程序设计,且无需编写撰写任何程序。
图五 : 数据收集 – ST软件与硬件工具
本文引用地址:http://www.eepw.com.cn/article/202112/430173.htm