MIL
- 格式:pdf
- 大小:375.71 KB
- 文档页数:13
Altium Designer MIL单位什么是Altium Designer?Altium Designer是一款专业的电子设计自动化(EDA)软件,用于电子产品的设计和开发。
它提供了完整的设计流程,包括原理图设计、PCB布局、仿真和制造输出等功能。
Altium Designer具有强大的功能和易于使用的界面,已成为全球电子工程师首选的设计工具之一。
MIL单位介绍MIL是英制长度单位之一,表示为千分之一英寸(thousandth of an inch)。
MIL 单位常用于电路板(PCB)设计中,用于测量线宽、间距和孔径等参数。
在Altium Designer中,MIL单位通常被用作PCB设计规格的单位。
Altium Designer中的MIL单位设置在Altium Designer中,可以通过以下步骤设置使用MIL单位:1.打开Altium Designer软件。
2.在菜单栏中选择”Preferences”(首选项)。
3.在弹出窗口中选择”Units”(单位)选项。
4.在”Display Units”(显示单位)下拉菜单中选择”Mils”(MIL)。
5.单击”OK”保存设置。
设置完成后,Altium Designer将使用MIL作为默认单位显示线宽、间距和孔径等参数。
使用MIL单位进行PCB设计在PCB设计过程中,使用正确的尺寸单位非常重要。
MIL单位的使用可以使设计工程师更方便地控制线宽、间距和孔径等参数,以确保电路板的性能和可靠性。
以下是一些使用MIL单位进行PCB设计的常见场景:1. 设置线宽和间距在Altium Designer中,可以直接在PCB编辑器中设置线宽和间距。
通过选择”Mils”作为单位,可以以MIL为基准设置线宽和间距,确保满足设计要求。
2. 定义孔径PCB设计中经常需要定义不同类型的孔径,如焊盘孔、过孔和安装孔等。
通过使用MIL单位,可以方便地指定所需的孔径尺寸,并确保与元器件规格和制造要求相匹配。
mil品质术语一、引言随着科技的飞速发展,军事装备的复杂性和重要性日益凸显。
为了确保军事装备在各种严酷环境下稳定可靠地工作,MIL品质术语成为了军事领域关注的焦点。
本文将对MIL品质术语进行详细解析,以期帮助读者更好地理解和应用这些关键概念。
二、MIL品质术语概述标准的起源和发展MIL标准起源于美国国防部,旨在为军事装备的研发、生产、测试和维修提供统一的标准和规范。
随着国际交流的不断加深,MIL标准逐渐成为全球军事领域的通用语言。
品质术语的定义和分类MIL品质术语主要包括可靠性、维修性、可用性、保障性、安全性等方面。
这些术语在军事装备的全寿命周期中具有至关重要的地位。
三、MIL品质术语的核心概念1.可靠性:指装备在规定的条件和时间内正常完成规定功能的概率。
2.维修性:指在规定条件下,用规定的方法和工具,迅速恢复装备正常状态的能力。
3.可用性:指装备在规定条件下,能够按照预期功能正常工作的能力。
4.保障性:指装备在使用过程中,满足保障需求的能力。
5.安全性:指装备在设计和使用过程中,确保人员、设备和环境安全的能力。
四、MIL品质术语在产品研发中的应用1.设计阶段的考虑因素在产品设计阶段,研发人员需充分考虑MIL品质术语的相关要求,以确保装备在实际使用过程中具备良好的可靠性、维修性等性能。
2.测试和评估过程中的应用在产品测试和评估阶段,需依据MIL品质术语制定相应的测试计划和评估标准,对装备的性能进行严格的检验。
五、MIL品质术语在项目管理中的应用1.制定项目质量计划项目管理人员需根据MIL品质术语的要求,制定项目质量计划,明确项目的质量目标和措施。
2.监控项目进度和成果项目管理人员需利用MIL品质术语的相关指标,对项目进度和成果进行实时监控,确保项目按计划推进。
六、提升MIL品质术语能力的建议1.学习和了解相关标准和规范要想在军事领域取得优异成绩,相关人员需学习和了解MIL品质术语的相关标准和规范,为其应用奠定基础。
MIL即为Matrox Imaging Library 的缩写,是加拿大Matrox公司提供的图像处理函数库,主要是针对其公司生产的Matrox系列图像采集卡。
我使用的是一个Matrox Morphis四通路图像采集卡,需要使用MIL开发自己的视觉系统。
几个常用的函数如下:MappAllocDefault();一个默认的配置,Application、System、Digitizer、Display、Buffer都是按照默认的情况进行配置。
MappAlloc();分配一个MIL应用,该函数要在使用其它MIL函数之前使用。
MsysAlloc();配置一个硬件环境,指定使用得板卡类型,使用板卡序号。
该函数要在分配buffer,display,digitizer前使用。
MdigAlloc();配置一个抽象的图像采集卡,指定可以使用的采集卡通道数,然后才能使用图像采集卡的函数。
MdispAlloc();配置一个display,把摄像机采集的图像使用该抽象进行显示。
MbufAlloc2d();分配一个2维的内存区。
MbufAllocColor();分配彩色内存区。
MappControl();改变指定的MIL应用的属性。
MsysControl();改变指定的系统的属性。
MdigControl();改变指定的图采卡属性。
MdispControl();改变指定的显示属性MappInquire();获取指定的应用配置情况MsysInquire();获取指定的应用系统情况MdigInquire();获取指定的采集卡配置情况MdispInquire();获取指定的显示配置情况MbufInquire();获取指定内存块的配置情况我使用的Matrox Morphis有四个通路,现在有两个摄像机需要采集数据。
黑白摄像机在插在0通路,为CCIR机制;彩色摄像机插在1通路,为PAL机制。
目前最广泛的标准视频是黑白:RS—170,使用在北美、日本、台湾等地区; CCIR,使用在欧洲、中国等地区。
mil品质术语摘要:1.品质术语的定义2.品质术语的重要性3.常见的品质术语4.品质术语在产品描述中的应用5.品质术语在国际贸易中的应用6.品质术语对消费者购买决策的影响7.应对品质术语的策略正文:品质术语是指用于描述产品或服务质量的词语或短语。
这些术语通常用来传达产品的特性、性能、耐用性、外观、可靠性等方面的信息。
品质术语在产品描述、广告宣传、国际贸易以及消费者购买决策中起着至关重要的作用。
品质术语的重要性在于,它们可以帮助消费者更好地了解产品的特点和优势,从而做出更明智的购买决策。
此外,品质术语还可以帮助生产商和销售商在激烈的市场竞争中脱颖而出,提升品牌形象和价值。
常见的品质术语包括:优质、高效、耐用、防水、防震、节能、环保、轻便、舒适、时尚等。
这些术语可以根据产品的不同特性进行选择和搭配,以充分展示产品的优势。
在产品描述中,品质术语被广泛应用于吸引消费者的注意力。
通过对产品特点的准确描述,品质术语可以帮助消费者对产品产生兴趣,并激发他们的购买欲望。
同时,品质术语还可以提高产品的信誉和口碑,从而促进销售。
在国际贸易中,品质术语对于保证货物的质量具有重要意义。
在国际贸易中,通常采用《国际贸易术语解释通则》(INCOTERMS)来明确双方的责任和义务。
例如,“FOB”(离岸价)、“CIF”(成本加保险费加运费价)等品质术语,可以帮助双方明确货物的交付条件、价格构成和风险承担等事项。
品质术语对消费者购买决策的影响主要体现在以下几个方面:1.产品质量:消费者通常认为,品质术语意味着产品的质量较高,可以满足他们的需求。
2.产品性能:品质术语可以向消费者传递产品的性能特点,帮助他们了解产品的优缺点。
3.产品价格:品质术语可以影响消费者对产品价格的预期。
一般来说,高品质的产品价格相对较高。
4.品牌形象:品质术语可以帮助消费者建立对品牌的信任和认同,从而影响他们的购买决策。
应对品质术语的策略主要包括:1.确保产品质量:生产商应努力提高产品质量,以满足消费者对品质的需求。
编程环境设置MIL全称为Matrox Imaging Library,由加拿大Matrox公司开发;MIL软件包是一个独立于硬件的、含有多个标准模块或组件的32位图像库,可以对图像进行采集、处理、分析、显示和存取操作,其功能覆盖图像领域的所有方面,使用起来也相当简单和方便;MIL-Lite是MIL的子集,含有MIL的部分模块,可以进行图像的采集、显示、存取操作,还可以在图像上进行图形操作及LUT变换等;MIL/MIL-Lite支持Matrox公司所有采集卡,如果应用程序采用其它公司的采集卡,则不能使用MIL/MIL-Lite的采集功能,但应用程序可以使用MIL/MIL-Lite的其它功能。
那么要采用MIL进行应用程序开发首先就要设置开发环境,放好动态链接库位置,链接好导入库文件,引入必要的.h头文件。
安装完MIL后(一般采取默认安装,即安装路径为C:\Program Files\Matrox Imaging),如下图其中Drivers为驱动文件,Images为示例图片文件夹,Intellicam为Intellicam软件,Mil 为开发用的文件,Tools为辅助开发的一些工具,MILControlCenter.hta为控制中心,MILInstall.log为安装日志因为我们要进行开发,所以进到Mil文件夹中,如下其中DLL为MIL的各个模块的动态链接库,DOC为帮助文档,Examples为VC示例,Include为必要的头文件,LIB为导入库文件那么为了进行开发首先应该将Dll文件加入系统Path路径,便于编译时找到相应模块的Dll,这一步安装MIL时已经默认做好了,若意外没有设置,则可如下手工设置然后将头文件加入系统路径,如下图(注意要把Include和Include\mildyn都加进来,VC 不会自己到include包含的文件夹中去搜索。
)然后,再加入导入库的路径lib为了保证设置一次,以后再写mil程序时即可用,请保证当前没有打开任何工程和文件,否则VC即认为当前加入系统头文件路径只是针对当前工程,这个设置被写到当前文件的设置文件中(应该是.dsp文件),而并不是记录到VC软件中。
Matrox Imaging Library (MIL)MIL函数功能包括:1. 点对点¾手动或自动阈值(二值化,裁剪)¾数学运算:加,减,乘,整数除,浮点除(两幅图像或一幅图像和常数),反色,取绝对值,拷贝图像(条件拷贝,标志拷贝等),重置缓冲区为一个常数¾逻辑运算:非,与,与非,或,或非,非或,非或非(两幅图像或一幅图像和一个常数)¾比较(最小值/最大值)¾移位¾LUT映射¾帧平均2. 统计¾亮度直方图¾最小/最大象素值¾定位常像素值¾计算两幅图像不同¾2D到1D映射¾直方图均衡3. 滤波¾去噪和图像平滑:低通空域滤波器(高斯),高阶(中值)滤波器¾边缘增强:锐化,带有增强对比度滤波器的锐化(继续)¾边缘检测(提取):水平,垂直,索贝尔,拉普拉斯,梯度¾任何大小核矩阵的自定义滤波器4. 形态学处理¾腐蚀,膨胀,打开,关闭,变薄(骨架),加厚,“中或不中”,二值匹配,区域,距离,标签¾自定义的形态学处理(形状和大小的结构元素自定义)5. 几何变换¾图像大小变换(临近象素或插值)¾图像旋转(临近象素或插值)¾亚像素变换¾极坐标变换(从笛卡尔坐标系到极坐标,反之亦然)¾变形使用一阶多项式或LUT6. 粒子分析¾独立标注¾面积¾重心¾边界:常规的,表面的¾大小:发线方向的直径(以特定角度计算最大值,最小值,平均值),长度(亚像素精素),宽度(亚像素精素),延伸率(长宽比)¾形状:简洁(密闭块),粗糙度(周长与表面周长比),块中的小孔数量,欧拉(块数量减孔数量),任何规则的中心和力矩¾定位:重心坐标(亚像素精度),限制框位置,最大最小值坐标,对应Y最大最小值的X像素坐标,对应X最大最小值的Y像素坐标¾游程(连续前景像素的水平线):总数,长度,位置¾沿粒子边界和/或内部小孔的连续像素或匹配像素¾灰度测量:所有像素总和,最大值,最小值,平均值,标准偏差,平方和,重心7. 测量指定或自动定位参考标记。
mil厚度单位
Mil厚度单位是一种常用的厚度测量单位,特别适用于测量薄膜、涂层和薄板等材料的厚度。
下面我们来了解一下关于mil厚度单位的一些知识点。
1. Mil厚度单位的定义
Mil是英语mil(thou)的简称,是一种长度单位,等于1/1000英寸(0.001英寸),通常用于测量非常薄的材料。
在美国,mil常用于测量塑料薄膜、金属箔、纸张等材料的厚度。
2. Mil厚度单位的应用
Mil厚度单位广泛应用于制造业、建筑业、印刷业等领域。
在制造业中,mil常用于测量塑料薄膜、金属箔、纸张等材料的厚度。
在建筑业中,mil常用于测量屋顶防水膜、地下排水系统等材料的厚度。
在印刷业中,mil常用于测量印刷版的厚度。
3. Mil厚度单位的转换
由于mil是英寸的千分之一,因此可以通过以下公式将mil转换为其他单位:
1 mil = 0.0254 mm
1 mil = 0.0000254 m
1 mil = 0.0001 inch
4. Mil厚度单位的优缺点
优点:mil单位能够准确地测量非常薄的材料,尤其是在需要精确控制材料厚度的领域中,如半导体制造、航空航天等领域。
缺点:mil单位只适用于测量非常薄的材料,对于厚度超过1英寸的材料,使用mil单位就不再适用。
此外,mil单位只用于英制单位系统中,不适用于国际单位制中。
以上就是关于mil厚度单位的一些知识点,希望对大家有所帮助。
目录目录 (1)I - 表格目录 (1)II - 图目录 (1)1. MIL-多功能接口板 (2)1.1. 主要功能 (2)1.2. 面板指示灯说明 (2)1.3. 电路板平面图 (2)1.4. 拨码开关和跳线说明 (3)1.5. 单板与背板间的接线说明 (5)1.6. 技术指标 (8)1.7. 注意事项 (8)I - 表格目录II - 图目录表1 MIL面板指示灯说明 (2)图1-2 ASL电路板平面图 (3)表2 拨码开关SW1的设置说明 (4)表3 J8、J9的设置说明 (4)表4 各插板的跳线设置 (4)表5 多功能接口板MIL欧式插座UJ1引脚信号定义 (5)表6 多功能接口板MIL欧式插座DJ1引脚信号定义 (7)表7 插板与出线说明 (8)-多功能接口板1.1. 主要功能●单板可插4个小插板●板内带DSP资源模块●支持插板类型:环路HL(1路)、磁石CS(2路)、二线音频Y2P(2路)、四线音频Y4P(2路)、选号XH(2路)、共电GD(只用于区间功能,2路)●增益软件可调●支持软件在线升级1.2. 面板指示灯说明表1 MIL面板指示灯说明1.3. 电路板平面图图1-2 ASL电路板平面图1.4. 拨码开关和跳线说明1.拨码开关SW1:拨码开关SW1保留,出厂设置全设成OFF。
表3 拨码开关SW1的设置说明2.跳线J8,J9:跳线J8和J9用于选择选择本板的工作状态,如下表所示。
J8和J9 跳上(ON)表示本板处于调试状态,可以通过串口下载数据或使用调试工具调试;不跳(OFF),本板处于正常工作状态。
表4 J8、J9的设置说明3.插座J1、J2、J4、J5:插板插座4.插座J3:14针DSP调试插座。
5.插座J6:20针ARM调试插座。
6.插座J7:10针CPLD(逻辑器件)编程插座。
7. 插座J10:28针CODETEST 插座。
8. 插座J11:4针串口座。
9.各插板上跳线设置表5 各插板的跳线设置1.5. 单板与背板间的接线说明表6 多功能接口板MIL欧式插座UJ1引脚信号定义表7 多功能接口板MIL欧式插座DJ1引脚信号定义说明:1.本板共有16对模拟线连线位置,位于欧式座UJ1上(A1、A2…C15、C16),其中A1、A2为一条模拟线对,C1、C2为一对。
mil品质术语摘要:一、前言二、MIL 品质术语的定义与背景 简介 品质术语的起源和发展三、MIL 品质术语的具体内容1.术语A 级和B 级2.术语C 级和D 级3.术语E 级和F 级四、MIL 品质术语在工业领域的应用1.电子行业2.汽车行业3.航空航天和军事领域五、MIL 品质术语在国际贸易中的作用六、我国对MIL 品质术语的认知与应对1.我国对MIL 品质术语的认知2.我国企业应对MIL 品质术语的策略七、结论正文:一、前言MIL 品质术语,即美国军标品质术语,是全球工业领域中广泛使用的一种品质等级标准。
了解和掌握MIL 品质术语,对于我国企业参与国际市场竞争、提升产品质量具有重要意义。
二、MIL 品质术语的定义与背景 简介MIL(Military Specification)是美国军用规格的缩写,由美国国防部制定并发布,用于规定美国军方及美国政府相关部门的设备和材料的技术要求、性能参数、试验方法等。
品质术语的起源和发展随着MIL 规格的广泛应用,产生了许多与品质相关的术语,如A 级、B 级、C 级等。
这些术语在工业领域被广泛接受,并逐渐发展成为国际通用的品质等级标准。
三、MIL 品质术语的具体内容1.术语A 级和B 级A 级和B 级是MIL 品质术语中的最高级别,表示产品在规定的试验条件下,各项性能指标均满足要求。
其中A 级要求产品的性能指标较B 级更为严格。
2.术语C 级和D 级C 级和D 级是MIL 品质术语中的中等水平,表示产品在规定的试验条件下,部分性能指标满足要求。
其中C 级要求产品的性能指标较D 级更为严格。
3.术语E 级和F 级E 级和F 级是MIL 品质术语中的基础级别,表示产品在规定的试验条件下,部分性能指标勉强满足要求。
其中E 级要求产品的性能指标较F 级更为严格。
四、MIL 品质术语在工业领域的应用1.电子行业在电子行业中,MIL 品质术语常用于描述元器件、电路板等产品的品质等级。
mil和MIL的正确使用
佚名
【期刊名称】《网印工业》
【年(卷),期】2007(000)002
【摘要】mil是英制长度计量单位,多用于表示涂层(涂覆层,即油墨涂层、油漆涂层或金属镀层)厚度,也有表示非金属薄膜或PCB中常用干膜的厚度,或表示线宽和线的间距,尤其在细线路的加工中应用较多。
1mil是1inch的千分之一.如果按公制计量为1mil=0.0254mm或者1mil=25.4μm.这在欧洲及北美技术文档及产品说明书中可以经常看到。
一般.mil发音读为“密尔”即可。
【总页数】1页(P40)
【正文语种】中文
【中图分类】TP311.5
【相关文献】
1.美陆军地面装备用防锈型液压油规格MIL-PRF-6083和MIL-PRF-46170
-STD-810中低限完整性振动试验的正确使用
3.金属有机框架MIL-100(Cr)和MIL-101(Cr)负载磷钨酸催化合成双酚F
-88B(V)和MIL-101(V)的合成及其NH3_SCR反应催化性能研究
5.铬-对苯二甲酸MOF的框架异构:MIL-88B(Cr)和MIL-101(Cr)
因版权原因,仅展示原文概要,查看原文内容请购买。
Matrox 图像采集卡有丰富的程序库——基本控制库(MIL—LITE),高级图像处理及模式识别库(MIL)。
可以在MS Visual C/C++,MS Visual Basic,Borland C/C++下调用其现有的图像处理函数。
程序运行在32位开发环境下,支持Windows95, NT及Dos4GW。
Mil是Matrox公司开发的高层图像处理软件开发包,是一个图像采集、传输、处理、分析和显示的一整套完整的程序库,包含了大量的优化函数用于图像处理。
Matrox Electronic systems ltd是一家加拿大公司,中文名为迈创,主要包括三个部门:Matrox graphics,Matrox imaging 和Matrox video。
Mil软件包是一种硬件独立,有标准组建的32位图像库。
有一整套针对图像处理的指令和特殊操作,包括:blob分析,图像校准,口径测定,二维数据读写,测量,图案识别以及光学符号识别操作。
为了便于快速开发Windows应用程序,Mil捆绑了ActiveMil,它是专为控制图像采集,传输,处理,分析以及显示而集成的ActiveX控件。
ActiveMil完全地融入了Microsoft Visual Basic/C++快速应用开发(RAD)环境中,以支持VB和VC开发。
MIL(Matrox lmaging LIbrary) 是Matrox 公司PCI 总线系列图像采集卡附带的开发软件包,是一套带有扩展优化函数的高级编程库,其函数用于图像采集、图像处理(例如:点对点、统计、滤波、形态学处理,几何变换,FFT 和分割),模式识别,blob 分析、边缘提取和分析、测量,字符识别,1D 和2D 条码识别,校准,图形、图像的压缩,显示和存档。
MIL 把图像采集卡、数据缓冲器、显示器等物理对象看成虚拟对象,在操作之前必须进行内存分配,在使用完后也必须进行资源释放Active MIL 是基于MIL 的控件集。
mil 舱标准
MIL-STD-202F标准中,对军用电子设备提出了16种环境适应性要求,其中对设备在运输、搬运过程中可能遇到的振动、冲击情况,提出了相应的振动、冲击试验要求。
MIL-STD-202F标准中,对设备在运输、搬运过程中可能遇到的振动、冲击情况,提出了相应的振动、冲击试验要求。
1. 振动试验:设备应能承受按表1规定的随机振动频率和加速度峰值施加于设备上的振动,且不应产生影响其性能的永久性变化。
2. 冲击试验:设备应能承受按表2规定的峰值加速度施加于设备上的冲击,且不应产生影响其性能的永久性变化。
以上信息仅供参考,如果您还有疑问,建议咨询专业人士。
ICT,In-Circuit Test 在线测试mil:长度计量单位,〔计〕密耳(=0.001英寸,线径单位文字)1mil=1/1000inch=0.00254cm=0.0254mm1inch=1000mil=2.54cm=25.4mm1mm=39.37milINGUN探针:主要有100系列、75系列、50系列,其中100系列是最热销、更常见的系列。
INGUN探针,用于测试PCBA(印刷电路板封装)的一种探针。
表面镀金,内部有平均寿命3万~10万次的高性能弹簧。
(德国INGUN探针在德国原厂空板测试是100万次,,我们这边是7天更换一次探针,按照产量计算可以推出使用次数为(18000+18000)*7=252000次)GKS100是INGUN公司的一款最普通的系列,也是全球最热销的,先简单介绍一下这款探针. 机械数据工作行程: 4.3mm最大工作行程: 6.35mm可选择弹力: 0.6N 1.0N 1.5N 2.25N 3.0N 4.0N额定电流: 2-3A电阻特性: <20µΩ材料材质:针杆: 铍铜或钢,镀金针管: 镍银合金或表铜,镀金弹簧: 钢,镀金套管: 黄铜,镀金ICT探针(ICT series Probes)一般直径在2.54mm-1.27mm之间,有业内的标准称呼100mil,75mil,50mil,还有更特别的直径只有0.19mm,主要用于在线电路测试和功能测试.也称ICT测试和FCT测试.也是目应用较多的一种探针.铍铜是以铍为主要合金元素的铜合金,又称之为铍青铜。
它是铜合金中性能最好的高级有弹性材料,有很高的强度、弹性、硬度、疲劳强度、弹性滞后小、耐蚀、耐磨、耐寒、高导电、无磁性、冲击不产生火花等一系列优良的物理、化学和力学性能。
我们厂采用的INGUN探针型号如下GKS 100 302 150 A 1000GKS100针的系列302中的3表示针头的头型材料,02表示针头的头型.(平头)150表示针头的直径.A表示针头的电镀材料.10表示探针的工作行程的弹力. 00表示铀环高度.。
多示例学习*周志华南京大学软件新技术国家重点实验室, 江苏南京 210093摘 要: 在多示例学习中,训练样本是由多个示例组成的包,包是有概念标记的,但示例本身却没有概念标记。
如果一个包中至少包含一个正例,则该包是一个正包,否则即为反包。
学习的目的是预测新包的类别。
由于多示例学习具有独特的性质,目前被认为是一种新的学习框架。
本文对该领域的研究进展进行了综述,并对有待深入研究的一些问题进行了讨论。
1 引言20世纪90年代以来,从例子中学习(learning from examples)被认为是最有希望的机器学习途径[1]。
如果以训练样本的歧义性(ambiguity)作为划分标准,则目前该领域的研究大致建立在三种学习框架(learning framework)[2]下,即监督学习、非监督学习和强化学习。
监督学习通过对具有概念标记(concept label)的训练例进行学习,以尽可能正确地对训练集之外的示例的概念标记进行预测。
这里所有的训练样本都是有标记的,因此其歧义性最低。
非监督学习通过对没有概念标记的训练例进行学习,以发现数据中隐藏的结构。
这里所有的训练样本都是没有标记的,因此其歧义性最高。
强化学习通过对没有概念标记、但与一个延迟奖赏或效用(可视为延迟的概念标记)相关联的训练例进行学习,以获得某种从状态到行动的映射。
这里所有的训练样本都是有标记的,但与监督学习不同的是,标记是延迟的,因此强化学习的歧义性介于监督学习与非监督学习之间。
20世纪90年代中后期,研究者们[3]在对药物活性预测(drug activity prediction)问题的研究中,提出了多示例学习(multi-instance learning)的概念。
在此类学习中,训练集由若干个具有概念标记的包(bag)组成,每个包包含若干没有概念标记的示例。
若一个包中至少有一个正例,则该包被标记为正(positive),若一个包中所有示例都是反例,则该包被标记为反(negative)。
通过对训练包的学习,希望学习系统尽可能正确地对训练集之外的包的概念标记进行预测。
与监督学习相比,多示例学习中的训练示例是没有概念标记的,这与监督学习中所有训练示例都有概念标记不同;与非监督学习相比,多示例学习中训练包是有概念标记的,这与非监督学习的训练样本中没有任何概念标记也不同;而与强化学习相比,多示例学习中又没有时效延迟的概念。
更重要的是,在以往的各种学习框架中,一个样本就是一个示例,即样本和示例是一一对应关系;而在多示例学习中,一个样本(即包)包含了多个示例,即样本和示例是一对多的对应关系。
因此,多示例学习中训练样本的歧义性与监督学习、非监督学习、强化学习的歧义性都完全不同,这就使得以往的学习方法难以很好地解决此类问题。
由于多示例学习具有独特的性质和广泛的应用前景,属于以往机器学习研究的一个盲区,因此在国际机器学习界引起了极大的反响,被认为是一种新的学习框架[2]。
*本文得到国家杰出青年科学基金(60325207)和国家自然科学基金(60473046)资助本文首先介绍多示例学习的起源,然后对该领域的研究进展进行综述,最后对有待深入研究的一些问题进行讨论。
2 问题的提出大多数药物都是一些分子,它们通过与较大的蛋白质分子例如酶等绑定来发挥作用,药效则是由绑定的程度决定的。
对适于制造药物的分子来说,它的某个低能形状和期望的绑定区域将耦合得很紧密;而对不适于制造药物的分子来说,它和期望的绑定区域将耦合得不好。
20世纪90年代中后期,T. G . Dietterich 等人[3]对药物活性预测问题进行了研究。
其目的是让学习系统通过对已知适于或不适于制药的分子进行分析,以尽可能正确地预测某种新的分子是否适合制造药物。
该问题的困难主要在于,每个分子都有很多种可能的低能形状,图1给出了一个例子。
而生物化学专家目前只知道哪些分子适于制药,并不知道具体的哪一种形状起到了决定性作用。
如果直接使用监督学习框架,将适于制药的分子的所有低能形状都作为正例,而将所有不适于制药的分子的所有低能形状都作为反例,则会由于正例中噪音度太高而难以成功地进行学习。
这是因为一个分子可能有上百种低能形状,而这么多形状中只要有一种是合适的,这个分子就适于制药。
为了解决这个问题,T. G . Dietterich 等人[3]将每一个分子作为一个包,分子的每一种低能形状作为包中的一个示例,由此提出了多示例学习的概念。
为了将分子的低能形状表示成属性-值对的形式,他们首先将分子固定在标准位置和朝向,然后从原点比较均匀地放射出162条射线,每条射线被原点与分子表面所截出的线段长度就被作为一个属性,如图2所示。
再加上4个表示固定的氧原子位旋转图1 一个内部键发生旋转,分子的形状就发生了显著变化图2 利用射线来表示分子形状置的属性,这样,包中的每个示例就由166个数值属性来描述。
在此基础上,他们提出了三个APR(Axis-Parallel Rectangles)学习算法[3]。
这些算法都是通过对属性值进行合取,在属性空间中寻找合适的轴平行矩形。
GFS elim-count APR算法先找出覆盖了所有正包示例的轴平行矩形,再以排除反包中的各示例所分别需要排除的正包示例数为标准,通过贪心算法逐渐排除反包示例以缩小矩形。
图3给出了一个例子。
图中同样颜色和形状的点表示同一个包中的示例,白色表示正包,黑色表示反包。
GFS elim-count APR算法先找出一个包含所有正包示例的轴平行矩形,如图中实线所示。
对该矩形所包含的每一个反包示例,图中都标出了为了通过收缩矩形的边界以将其排除所需付出的代价,即所需附带排除的最少的正包示例数。
GFS elim-count APR算法就根据这些代价,贪心式地逐渐缩小矩形,从而得到了图中虚线所示的结果。
最后,该算法通过贪心属性选择确定该矩形在相关属性上的边界,这样就得到了学习结果。
图3 GFS elim-count APR算法运行的例子GFS kde APR算法则是在GFS elim-count APR的基础上,考虑矩形所覆盖的各正包中的示例数,利用一个代价函数来使得在排除反包示例时,尽可能少地排除剩余示例较少的正包中的示例。
Iterated-discrim APR算法先通过贪心式的backfitting算法[4]找出一个覆盖了每个正包中至少一个示例的最小矩形,然后利用该矩形挑选出最具有区别能力的一组属性,在此基础上,通过核密度估计(kernel density estimation)对最可能出现正包示例的矩形边界不断进行扩展。
T. G. Dietterich等人[3]利用麝香(musk)分子的数据进行了实验,发现Iterated-discrim APR算法在药物活性预测问题上取得了最好的效果,而C4.5决策树、BP神经网络等常用的监督学习算法效果很不理想。
这说明如果不考虑多示例学习本身的特点,将难以很好地完成此类学习任务。
另外,T. G. Dietterich等人[3]指出,由于Iterated-discrim APR算法根据麝香分子的数据进行了优化,因此,在该数据集上该算法的性能也许代表了一个上限。
实际上,多示例学习问题其实是一直存在的,并不是由于对药物活性预测问题的研究而突然出现的。
只是以往的机器学习研究[5, 6]并没有明确考虑此类问题的特性,到了T. G. Dietterich等人的工作中才正式地把这个问题界定出来。
值得注意的是,多示例学习还引起了归纳逻辑程序设计(inductive logic programming,简称ILP)[7]领域的研究者的兴趣。
机器学习常用的属性-值对表示方法实际上是一种命题知识表示,而ILP领域的研究使用的是一阶知识表示。
一阶知识表示的表达能力比命题知识表示强得多,但要高效地进行学习却非常困难。
L. De Raedt[8]认为,多示例表示为命题知识表示和一阶知识表示建立了联系,在这种表示下,既有助于利用一阶表示的表达力又有助于发挥命题学习的高效性。
因此,ILP领域的研究者也对多示例学习进行了研究,但由于这些工作与目前一般意义上的机器学习有较大差别,本文没有对此进行介绍。
3 研究进展3.1 可学习性T. G. Dietterich等人的工作刚公布,P. M. Long和L. Tan[9]就对多示例学习框架下APR的PAC可学习性[10]进行了研究。
他们证明,在多示例学习框架下,如果包中的示例是独立的,且符合积分布(product distribution),则APR是可以PAC学习的。
在此基础上,他们提出了一种学习复杂度很高的理论算法。
此后,P. Auer等人[11]提出了一种改进的理论算法,该算法不再要求包中示例符合积分布,而且其学习复杂度比P. M. Long和L. Tan的算法低得多。
更进一步,P. Auer[12]将该理论算法转变为一种可以用于解决实际问题的应用算法MULTINST,并且通过在麝香分子数据上的实验显示出该算法在药物活性预测问题上的可用性。
1998年,A. Blum和A. Kalai[13]将多示例学习框架下的PAC学习归结为单边随机分类噪音下的PAC学习。
这就使得双边随机噪音模型以及校验函数等在单边噪音下可学习的概念类可以从多示例的角度进行学习。
在此基础上,他们得到了一个比P. Auer等人[9]的结果更高效的理论算法。
表1对上述工作进行了总结,其中(1-ε)与δ分别表示精确度与置信度,d和n分别为APR的维数以及每个包中所含的示例数,样本复杂度是指训练包的数目,i O表示忽略结果中的对数项。
值得注意的是,这些工作都假设包中示例是独立的,但遗憾的是,该假设在真实问题中显然是难以成立的,例如在药物活性预测问题中,同一个分子的低能形状之间是有密切联系的。
表1 多示例学习可学习性的主要研究结果样本复杂度时间复杂度假设条件主要分析工具P. M. Long和L. Tan的结果2610(logd n ndOεεδ512220(log)d n ndOεεδ包中示例相互独立,且满足积分布P-conceptVC维的变体P. Auer 等人的结果222(log)d n dOεδi322()d nOε包中示例相互独立 VC维A. Blum和A. Kalai的结果i22(d nOεi322()d nOε包中示例相互独立统计查询模型VC维总的来看,计算学习理论界为了分析多示例学习的可学习性,提出了一系列多示例学习理论算法。
但由于理论工具的制约,几乎所有的理论算法都对包中示例的分布等施加了种种限制,这就使得这些理论算法难以直接用于解决实际的问题。
因此,这些工作更重要的是丰富了PAC理论本身的研究。