时间:2025-09-01 14:08 / 来源:未知

  • 我们证明了15个定理ptcg规则说明书跟着流露练习周围的成长,为体会决差异种别的题目,浮现了大批差异的耗费函数。咱们提出一个团结的新闻论方程,可能增添机械练习中很众新颖耗费函数。的确而言,咱们引入了一个框架,解释若干普通的机械练习手腕本质上恰是正在最小化两个条款分散之间的积分KL散度:监视流露与练习到的流露。这一主张揭示了聚类、谱手腕、降维、比较练习和监视练习背后躲藏的新闻几何组织。该框架使得咱们可能通过协调文献中胜利的百般技巧,开垦出新的耗费函数。咱们不但供应了普通的阐明,衔接了超越23种差异的手腕,还行使这些外面成就修建了目前最优秀的无监视图像分类器,正在ImageNet-1K上的无监视分类义务中比先前的最优秀手腕擢升了+8%。其它,咱们还揭示了I-Con可用于推导出有外面根据的去偏手腕,从而擢升比较流露练习器的机能。

  正在过去十年中,流露练习周围振奋成长,新的技巧、架构和耗费函数司空见惯。这些发扬促进了筹划机视觉、自然讲话处分和众模态练习等周围最优秀模子的成长,大凡仅需极少的人工监视。然而,跟着该周围的一直扩展,耗费函数的众样性使得人们越来越难以懂得差异手腕之间的合连,以及哪些宗旨函数最适合特界说务。

  正在本筹议中,咱们提出了一种通用的数学框架,将涵盖监视练习、无监视练习和自监视练习正在内的普通流露练习技巧,团结到一个简单的新闻论宗旨之下。咱们的框架——新闻比较练习(Information Contrastive Learning, ICon)解释,很众看似千差万别的手腕,网罗聚类、谱图外面、比较练习、降维和监视分类,本质上都是统一底层耗费函数的特例。

  只管先前的筹议一经出现了流露练习手腕中某些子集之间的伶仃合联,大凡一次仅衔接两到三种技巧(Sobal 等,2025;Hu 等,2023;Yang 等,2022;Böhm 等,2023;Balestriero & LeCun,2022),但ICon是首个将超越23种差异手腕团结正在一个宗旨函数之下的框架。这种团结的视角不但澄清了现有技巧的内正在组织,还为正在古板上互相独立的周围之间迁徙思思和改正手腕供应了坚实的本原。

  基于ICon,咱们推导出新的无监视耗费函数,正在圭臬图像分类基准测试上明显优于以往手腕。咱们的厉重功绩如下:

  • 咱们提出了ICon,一种简单的新闻论耗费函数,可能增添流露练习中的众个厉重手腕种别。

  • 咱们阐明了15个定理,揭示了众种差异算法奈何行动ICon的特例浮现。

  流露练习涵盖了一系列从纷乱数据中提取组织的手腕。咱们记忆了ICon所基于并增添的若干筹议倾向。合于该周围的周到综述,可参睹(Le-Khac等,2020;Bengio等,2013;Weng,2021)。

  特色练习旨正在行使监视信号(如成对类似性、比来邻、数据加强、种别标签或重构耗费)来提取具有新闻量的低维嵌入。经典手腕如主因素分解(PCA,Pearson,1901)和众维标准分解(MDS,Kruskal,1964)注重于维系数据的全部组织,而UMAP(McInnes等,2018)和t-SNE(Hinton & Roweis,2002;Van der Maaten & Hinton,2008)则通过最小化连合分散之间的散度来合怀部分拓扑组织。ICon采用了雷同的“最小化散度”视角。

  比较练习手腕,如SimCLR(Chen等,2020a)、CMC(Tian等,2020)、CLIP(Radford等,2021)和MoCo v3(Chen*等,2021),大凡行使正样本对和负样本对,这些样本对常通过数据加强或跨模态对齐修建。ICon正在一个团结的基于KL散度的框架内增添了这些耗费函数,揭示了它们之间的渺小不同。监视分类器(比如ImageNet模子,Krizhevsky等,2017)也能天生有用的特色流露,ICon通过将种别标签视为离散的比较点,从新解说了这类手腕,从而正在监视练习与无监视练习之间设置了桥梁。

  聚类手腕通过隔绝器量、图划分或比较性监视来出现数据中的离散组织。k均值(k-Means,Macqueen,1967)、EM算法(Dempster等,1977)和谱聚类(Shi & Malik,2000)是本原性算法。近年来的手腕,如IIC(Ji等,2019)、比较聚类(Contrastive Clustering,Li等,2021)和SCAN(Gansbeke等,2020),行使了稳固性(invariance)和邻域组织。西宾-学生模子(如TEMI,Adaloglou等,2023)以及基于指数搬动均匀(EMA)的架构(Chen等,2020b)进一步擢升了聚类机能。ICon通过将聚类诱导的连合分散与来自类似性、组织或比较信号的宗旨分散对齐,涵盖了这些手腕。

  流露练习的团结性筹议方面,已有使命物色了比较练习与t-SNE之间的合联(Hu等,2023;Böhm等,2023)、比较耗费与交叉熵耗费之间的等价性(Yang等,2022),以及谱手腕与比较手腕之间的合连(Balestriero & LeCun,2022;Sobal等,2025)。其他试验,如贝叶斯语法模子(Grosse等,2012),供应了概率视角。Tschannen等(Tschannen等,2019)夸大了互新闻框架中预计器和架构安排的紧急性,但未能告终更普通的团结。

  只管先前的筹议一经将这些手腕中的个人子集合联起来,但据咱们所知,ICon是首个将监视练习、比较练习、聚类和降维等宗旨团结于简单耗费函数之下的框架。这一视角阐清楚它们共有的组织,并为成长新的练习道理启迪了道道。

  3 手腕I-Con框架将众种流露练习手腕团结到一个简单的耗费函数之下:最小化两个条款“邻域分散”之间的均匀KL散度,这两个分散界说了数据点之间的迁移概率。这一新闻论宗旨泛化了来自聚类、比较练习、降维、谱图外面和监视练习等众种技巧。通过更正监视分散和练习分散的修建式样,I-Con涵盖了大批现有手腕以及别致手腕。咱们提出了I-Con,并揭示了其正在团结差异周围技巧方面的巨大才力,以及正在差异周围之间迁徙思思的潜力,从而催生了一种目前最优秀的无监视图像分类手腕。

  3.2 操纵I-Con团结流露练习算法只管公式(1)极其简明,但它具有足够的外达才力,只需拔取适宜的参数化邻域分散 pθ和 qϕ,即可增添文献中的众种现有手腕,如图1所示。咱们正在图2a中对 pθ和 qϕ的常睹拔取举办了分类。

  外1总结了极少合节拔取,这些拔取可重现来自比较练习(SimCLR、MoCo v3、SupCon、CMC、CLIP、VICReg)、降维(SNE、t-SNE、PCA)、聚类(K-Means、谱聚类、DCD、PMI)以及监视练习(交叉熵耗费、调停耗费)等周围的时兴手腕。因为篇幅限度,各定理的阐明均移至填补原料中。咱们还当心到,外1并未穷尽统统能够,荧惑筹议社区物色其他练习框架是否也正在隐式地针对某种 p和 q的拔取最小化公式(1)。

  3.2.1 示例:SNE、SimCLR 和 K-Means只管I-Con团结了普通的手腕,咱们正在此通过揭示 p和 q的差异拔取奈何复现SNE、SimCLR和K-Means等经典技巧来加以申明。完备细节睹附录。

  3.3 操纵I-Con创筑新的流露练习手腕I-Con框架正在简单数学样子下团结了百般流露练习手腕,而且合节的是,它鼓吹了差异周围之间技巧的迁徙与协调。

  本文中,咱们揭示了奈何通过梳理新颖流露练习手腕,开垦出机能超越以往秤谌的聚类和无监视分类算法。的确而言,咱们协调了谱聚类、t-SNE 和去偏比较练习(Debiased Contrastive Learning, Chuang 等,2020)的洞睹,修建了一个目前最优秀的无监视图像分类流程。

  3.3.2 通过匀称分散告终去偏咱们的第一个示例采用了一个简陋的匀称羼杂分散:

  此中 N是部分邻域的巨细,α流露羼杂的水平。该手腕为每个“负”样天职派一个较小的概率质料 Nα,从而缓解了对邻域分派过于置信的题目。正在监视练习场景中,这雷同于标签滑润(label smoothing, Szegedy 等,2016)。比拟之下,Chuang 等(2020)则维系标签为独热(one-hot)样子,直接编削softmax函数自身。

  另一种懂得该手腕的角度是通过更重尾部或更广泛的分散来对付。通过增添一个匀称分散因素,咱们模拟了t-SNE中操纵的学生t分散(Van der Maaten & Hinton, 2008)的思思,该分散会对较远的点分派更大的概率质料。正在这两种处境下,扩展分散都有助于消浸对窄小界说的邻人结合过拟合的危急。

  外3以及图5和图6中的测验结果解释,这种轻量级的编削正在百般义务和批量巨细下均能连续擢升机能。它还能“缓解”过于置信的分散,雷同于监视练习中交叉熵耗费的标签滑润,从而提防梯度消亡题目。

  3.3.3 通过邻人宣扬告终去偏第二种战术采用基于图的扩展手腕。如外1所示,将K均值中的高斯邻域更换为度加权的k近邻,即可取得谱聚类,而谱聚类以鲁棒性和高质料聚类结果著称。受此劝导,咱们操纵基于KNN(k近邻)的邻域界说来练习比较练习模子。正在给定比来邻图的本原上,咱们能够通过举办更长途径的随机逛走进一步扩展该图,这一历程雷同于Word-Graph2Vec 或 tsNET(Li 等,2023;Kruiger 等,2017),咱们将其称为邻人宣扬(neighbor propagation)。

  此中 I[⋅]是指示函数。这种基于随机逛走的滑润手腕扩展了有用的邻域领域,使得模子可能从更鳞集的监视信号中举办练习。

  外3和外4的结果证明,采用这种基于宣扬的手腕正在无监视图像分类义务中带来了明显机能擢升,凸显了邻域扩展行动一种去偏战术的有用性。

  正在本节中,咱们揭示了I-Con框架可能提出可验证的假设,并为自监视和无监视练习供应适用的洞睹。咱们的宗旨不但仅是探索最优秀的机能,更紧急的是揭示奈何通过团结的新闻论手腕,行使I-Con来加强现有的无监视练习手腕。通过这一框架,咱们还夸大了聚类、比较练习和降维等差异机械练习周围技巧之间互相鉴戒的潜力。这种由I-Con所救援的技巧迁徙,可能明显改正现有手腕,并为来日物色启迪新的倾向。

  咱们将测验重心放正在聚类义务上,由于与比较练习比拟,聚类正在目前筹议中相对较少被深切研究,而现在已有众种技巧能够适配到这一义务中。通过正在I-Con框架下将k均值、SimCLR和t-SNE等经典手腕合联起来,咱们出现了大批改正聚类手腕的能够性。咱们通过测验验证了这些外面洞睹,揭示了I-Con的本质影响。

  咱们操纵ImageNet-1K数据集(Deng等,2009)举办评估,该数据集包括1000个种别和超越一百万张高辞别率图像。因为其范围重大且实质纷乱,该数据集被以为是无监视图像分类最具挑拨性的基准之一。为了与先前的筹议举办公正比力,咱们端庄从命Adaloglou等(2023)提出的测验合同。评估聚类机能的厉重目标是匈牙利切确率(Hungarian accuracy),该目标通过匈牙利算法(Ji等,2019)寻找预测聚类与确实标签之间的最优完婚,从而权衡聚类分派的质料。这种手腕正在练习历程中缺乏直接标签监视的无监视场景下,供应了对聚类机能的端庄评估。

  正在特色提取方面,咱们采用了三种差异范围的DiNO预练习视觉Transformer(ViT)模子:ViT-S/14、ViT-B/14 和 ViT-L/14(Caron等,2021)。拔取这些模子既是为了与先前使命维系可比性,也是为了探究I-Con框架正在差异模子容量下的显示。测验设备(网罗练习合同、优化战术和数据加强手腕)均与TEMI中操纵的手腕维系划一,以确保手腕论的划一性。

  练习历程网罗正在DiNO模子提取的特色之上优化一个线性分类器。每个模子均练习30个epoch,操纵ADAM优化器(Kingma & Ba,2017),批量巨细为4096,初始练习率为1e-3。每10个epoch将练习率衰减为正本的一半,以确保太平收敛。咱们过错特色向量举办异常的归一化处分。正在练习历程中,咱们行使了众种数据加强技巧,网罗随机缩放、裁剪、颜色震颤和高斯混沌,以天生鲁棒的特色流露。其它,为了擢升聚类机能,咱们操纵余弦类似度预先筹划了数据纠合每张图像的全部比来邻。这使得咱们正在每个练习批次中可认为每张图像采样两个加强版本和两个比来邻样本,从而将部分和全部新闻都融入到练习到的流露中。咱们正在外2中将所提出的手腕称为“InfoNCE Clustering”(新闻比较聚类)。的确而言,咱们的监视邻域由数据加强样本、KNN(k=3)以及长度为1的KNN逛走组成。咱们采用k均值中的“按种别共享的聚雷同然”邻域(详睹外1中的的确公式)行动练习到的邻域函数,以驱动聚类练习历程。

  4.1 基线手腕咱们将咱们的手腕与几种目前最优秀的聚类手腕举办了比力,网罗TEMI、SCAN、IIC和比较聚类(Contrastive Clustering)。这些手腕依赖于数据加强和练习到的流露,但大凡须要异常的正则化项或耗费函数调解,比如左右聚类巨细或消浸类似性耗费的权重。比拟之下,咱们基于I-Con的耗费函数具有自均衡性情,无需此类人工调参,使其成为一种更简明、外面本原更坚固的手腕。这使得咱们正在三种差异范围的主干收集上均告终了更高的切确率和更太平的收敛。

  4.2 测验结果外2比较了去偏的InfoNCE聚类手腕(Debiased InfoNCE Clustering)正在差异DiNO变体(ViT-S/14、ViT-B/14、ViT-L/14)以及其他众种新颖聚类手腕上的匈牙利切确率。I-Con框架正在统统模子范围下均连续优于之前的最优秀手腕。的确而言,对付DiNO ViT-B/14和ViT-L/14模子,去偏的InfoNCE聚类手腕比拟此前最优秀的ImageNet聚类手腕TEMI,匈牙利切确率阔别擢升了+4.5%和+7.8%。咱们将这些机能擢升归因于两个厉重要素:

  自均衡耗费:与TEMI或SCAN等须要人工调参正则化项(比如均衡聚类巨细或调解类似性耗费的权重)的手腕差异,I-Con的耗费函数可能自愿均衡这些要素,无需异常的正则化超参数调优,由于咱们操纵了与k均值沟通的聚类核函数。这一外面本原使得聚类结果特别鲁棒且切确。

  跨周围洞睹:I-Con鉴戒了比较练习中的思思,通过基于图像嵌入流露的成对合连来优化聚类,将数据加强样本和左近样本一概对付。这种正在比较练习中已被阐明胜利的手腕,很好地迁徙到了聚类义务中,明显擢升了正在噪声大、高维图像数据上的机能。

  咱们举办了众项融解筹议,以通过测验验证从I-Con框架分解比较聚类所衍生出的架构改正的有用性。这些融解测验厉重聚焦于两个合节方面:将去偏机制引入宗旨分散空间和嵌入空间的效益,以及差异邻人宣扬战术的影响。

  咱们对宗旨分散中差异秤谌的去偏举办了测验,此中去偏水平由参数 α 左右,并测试了以下几种筑设:仅正在宗旨侧举办去偏、正在两侧(宗旨分散和练习到的流露)都举办去偏,以及统统不举办去偏。如图6所示,引入去偏可能擢升机能,最优值大凡正在 α = 0.6 到 α = 0.8 之间,越发是正在练习历程的两侧都行使去偏时效益最佳。该手腕雷同于比较练习中的去偏机制,即假设每个负样本都有肯定的非零概率(α/N)本质上是过错的(即能够是正样本)。图5揭示了正在差异批量巨细下,更正 α 值对机能的擢升效益。

  正在第二组测验中(如外4所示),咱们侦查了邻人宣扬战术的影响。咱们评估了正在比较耗费筹划中引入部分和全部邻人时对聚类机能的影响。邻人宣扬(越发是小标准下,如 s = 1 和 s = 2)正在统统模子范围上均明显擢升了机能,解释搜捕嵌入空间中的部分组织至合紧急。而更大的宣扬步长(比如 s = 3)带来的增益慢慢减小,解释太过宣扬能够会稀释来自比来且最合联点的新闻。须要当心的是,惟有 DiNO-L/14 模子更偏好较大的步长,这能够是由于其具有更强的k近邻识别才力,所以扩展的衔接更能够是确切的。

  咱们的融解筹议解释,对去偏参数和邻人宣扬战术举办细小调解,即可通过一个简陋的耗费函数告终明显机能擢升,抵达目前最优秀的效益。其它,差异模子对 α 和宣扬步长的敏锐性有所差异:更大的模子大凡能从更大的宣扬领域中获益更众,但须要对 α 举办缜密调参以抵达最佳机能。咱们倡议将 α 设备正在 0.6 到 0.8 之间,并将邻人宣扬限度正在较小的领域内,以正在机能和筹划效力之间博得优秀均衡。

  5 结论综上所述,咱们提出了I-Con:一个简单的新闻论方程,团结了普通种别的机械练习手腕。咱们供应了超越15个定理,阐明了该方程实用于目前正在聚类、谱图外面、监视与无监视比较练习、降维以及监视分类与回归等义务中普通操纵的诸众主流耗费函数。咱们不但正在外面上团结了这些算法,还揭示了这种团结合连可能助助咱们出现新的最优秀手腕,并将某一手腕中博得的改正迁徙到该种别中的其他手腕。咱们通过修建一种新的无监视图像分类手腕,验证了这一点,该手腕比拟先前的最佳手腕告终了+8%的机能擢升。咱们信赖,本使命所揭示的结果仅是I-Con能够团结的手腕中的一小个人,咱们生气筹议社区可能行使这一视角,鼓吹差异算法和机械练习周围之间的合营与分解。

  希罕声明:以上实质(如有图片或视频亦网罗正在内)为自媒体平台“网易号”用户上传并发外,本平台仅供应新闻存储任职。

  女子酒后与妹妹因算帐狗屎冲突,凌晨5点将2只狗从21楼扔下……被判拘役4个月,缓刑8个月

  意大利女子拍浮名将涉嫌正在新加坡偷盗被捕:刚拿来世锦赛铜牌,回邦进展途中被抓,应酬部长遑急介入

  《编码物候》展览揭幕 北京时间美术馆以科学艺术解读数字与生物交错的宇宙节律

  尔英发外瑶光 MoDT M-ATX 主板:搭载 AMD 锐龙 7000HX 处分器

  首款 6K 雷电 5 显示器 LG 32U990A 更众新闻曝光:HDR600 认证

  千万没思到:苹果已停售MagSafe外接电池可用于谷歌 Pixel 10 Pro


外汇交易无重复报价,并按实时报价执行交易

通过FXCG MT4交易平台随时随地进入全球市场。