Zero-shot学习(Zero-shot Learning, ZSL)是一种机器学习范式,其核心目标是使模型能够识别或理解在训练阶段从未见过任何具体样本的新类别。它通过迁移已学知识并利用类别之间的语义关联,实现了从已知领域向未知领域的泛化能力。
想象一下,一个从未见过“斑马”的孩子,如果他知道“马”的样子和“老虎”的条纹,当被告知“斑马是一种有黑白条纹的马科动物”时,他就能在第一次见到斑马时将其识别出来。Zero-shot学习的原理与此类似。

其工作流程通常包含两个关键空间:视觉特征空间(如图像的像素、形状、纹理等)和语义属性空间(如“有条纹”、“是哺乳动物”、“生活在草原”等文本描述的属性或词向量)。在训练阶段,模型学习已知类别的视觉特征与其对应语义属性之间的映射关系。当面对一个全新的类别时,模型仅需获得该新类别的语义描述(作为“知识”或“桥梁”),便可通过已建立的映射关系,在视觉特征空间中定位并识别出这个新类别,而无需任何该新类别的图像样本。这本质上是一种从已知到未知的知识迁移和推理过程。

理解Zero-shot学习,可关联以下概念:少样本学习、迁移学习、元学习、语义嵌入、广义Zero-shot学习。

若想深入了解,建议从阅读经典论文《Label-Embedding for Attribute-Based Classification》开始,它奠定了属性嵌入的基础。同时,可以关注计算机视觉顶会(如CVPR、ICCV)中关于“开放集识别”和“零样本学习”的最新研究进展,这些领域与Zero-shot学习紧密相关且发展迅速。
