few-shot learning几篇论文-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

few-shot learning几篇论文

阅读量：4145 次

发布时间：2019-05-25

本文共 2665 字，大约阅读时间需要 8 分钟。

Prototypical Networks for Few-shot Learning

论文链接：

开源代码：

发表时间：2017年6月

该论文属于metric_based

论文中心思想：经过神经网络学会一个映射，将所有样本映射到同一空间，每个类别样本存在一个原型（我理解就是每个聚类的中心），该原型就是对应类别所有样本embedding的均值。局里度量是欧式距离的平方，训练时，每个query set中样本embedding到所属类别的原型距离越近越好，到其他类别原型距离越远越好。

论文创新点：原型（即class_level representation）

算法结构

注：上如图J更新公式有一处错误，最后的 $c_k$ 应该为 $c_{k'}$ 。

loss函数：
$p_{\phi}(y=k|x)=\frac{exp(-d(f_{\phi}(\mathbf{x}),\mathbf{c}_k))}{\sum_{k'}exp(-d(f_{\phi}(\mathbf{x}),\mathbf{c}_{k'}))}$
$J(\phi)=-logp_{\phi}(y=k|x)$

Hybrid Attention-Based Prototypical Networks for Noisy Few-Shot Relation Classification

论文链接：

开源代码：

发表时间：2019年

该论文属于metric_based

论文中心思想：该论文是基于NLP的，包括三大模块：1）Instance Encoder模块：输入为一句文本，将其编码为一个向量；2）Prototypical Networks：基于模块1）为support set中的每个instance(sentence)计算一个embedding，输入到Prototypical Networks，为每个Relation（分类中是每个类）计算一个原型（原型的概念参看上篇论文）；3）Hybrid Attention：该模块是模块2）的一部分，通常计算原型时是直接对support set中每个instance的embedding求和或求均值，这样易受噪声影响，该模块提出了两种注意力机制，一个是instance-level注意力，利用注意力机制给每个instance赋予不同权重，然后求原型；另外一种是feature-level注意力机制，用于识别对分类有辨别力的特征维度。

论文创新点：混合注意力机制：1）instance-level注意力机制：降低噪声样本影响，同时选出对query判别游泳的instance；2）feature-level注意力机制：选出对任务有用的特征维度。

算法结构：

loss函数：

$p_{\phi}(y=r_i|x)=\frac{exp(-d(f_{\phi}(\mathbf{x}),\mathbf{c}_i))}{\sum_{j'}exp(-d(f_{\phi}(\mathbf{x}),\mathbf{c}_{j'}))}$
$J(\phi)=-logp_{\phi}(y=k|x)$

Few-Shot Text Classification with Induction Network

论文链接：

开源代码：论文中说会公开代码和数据，目前还未找到

发表时间：2019年2月

该论文属于metric_based

论文中心思想：该论文是基于NLP的，包括三大模块：1）Encoder模块：利用带有self-attention的Bi-LSTM对输入的文本进行编码；2）Induction模块:每个sample经过模块1）得到sample-level representation，该模块采用Dynamic Routing Induction，将sample-level 的representation转换为class-level representation，即求出每个类的feature(对应于上篇论文中的原型)；3）Relation模块：计算每个query set中的样本和每个类的关系得分。

论文创新点：多数算法求每个类的class-level特征是取该类中所有样本特征的和或均值，这样noise样本会影响该类的特征表达；本论文提出的induction模块采用dynamic routing算法能够保护每个类的深度语义表达，同时减轻noise样本影响。

算法结构：

loss函数：MSE
$=\sum_{i=1}^C\sum_{q=1}^n(r_{iq}-\mathbf{1}(i==y_q))^2$
$i$ 表示低 $i$ 类， $q$ 表示第 $q$ 个样本， $r_{iq}$ 表示网络输出的得分， $y_q$ 表示第 $q$ 个样本的标签。

Learning to Compare: Relation Network for Few-Shot Learning

论文链接：

开源代码： (Few-shot) (zero-shot)

发表时间：2018年3月

该论文属于metric_based

论文是针对Relation 模块进行创新的，详细请参看

转载地址：http://kwnti.baihongyu.com/

你可能感兴趣的文章

人脸识别(OpenCV+Python)

6个强大的AngularJS扩展应用

网站用户登录系统设计——jsGen实现版

第三方SDK：讯飞语音听写

第三方SDK：JPush SDK Eclipse

第三方开源库：imageLoader的使用

自定义控件：飞入飞出的效果

自定义控件：动态获取控件的高

第三方开源库：nineoldandroid：ValueAnimator 动态设置textview的高

第三方SDK：百度地图SDK的使用

Android studio_迁移Eclipse项目到Android studio

JavaScript setTimeout() clearTimeout() 方法

CSS border 属性及用border画各种图形

转载知乎-前端汇总资源

JavaScript substr() 方法

JavaScript slice() 方法

JavaScript substring() 方法

HTML 5 新的表单元素 datalist keygen output

（转载）正确理解cookie和session机制原理

jQuery ajax - ajax() 方法

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-09-23 04:31:22 当前IP: 18.224.54.136 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我