谷雨润一麦的博客_云社区-华为云

Lv.3

谷雨润一麦

更多个人资料

273 成长值

6 关注

18 粉丝

+ 关注私信

个人介绍

算法攻城狮，接触过数学、网络安全、密码、云计算、深度学习，能力之内聊点技术。

感兴趣或擅长的领域

人工智能、大数据、云安全、云计算

个人勋章

TA还没获得勋章~

成长雷达

250

个人资料

个人介绍

算法攻城狮，接触过数学、网络安全、密码、云计算、深度学习，能力之内聊点技术。

感兴趣或擅长的领域

人工智能、大数据、云安全、云计算

达成规则

以上满足项可达成此勋章

博客
关注
粉丝
论坛

全部时间

最近一月

全部
暂无专栏分类

基于深度学习的场景文字检索

文字检索是从图像库中检索出包含特定字符串的图像，并且同时定位该字符串在图像中位置的过程（如图1所示），是场景文字理解中的重要科学问题，被应用于商品检索、图书馆书籍管理、网络图像安全审核等场景中，极大地提高了生产效率。此外，文字识别要求图像中的所有文本实例都被精准地检测和识别，不同于端到端的文字识别任务，文字检索任务更关注于搜寻用户所感兴趣的文本。

人工智能 EI企业智能 Image 图像处理深度学习

谷雨润一麦 2022-04-25 11:39:31

11017

2022-04-25 11:39:31

999+

[CVPR 2022] 基于场景文字知识挖掘的细粒度图像识别算法

本文简要介绍CVPR 2022录用的论文“Knowledge Mining with Scene Text for Fine-Grained Recognition”的主要工作。该论文旨在利用场景文本的线索来提升细粒度图像识别的性能。本文通过场景文字从人类知识库（Wikipedia）中挖掘其背后丰富的上下文语义信息，并结合视觉信息来共同推理图像内容。数据集和代码已开源，下载地址见文末。

人工智能 EI企业智能 Image 图像处理

谷雨润一麦 2022-04-19 12:37:34

14096

2022-04-19 12:37:34

999+

Multi-Model Text Recognition Network

语言模型往往被用于文字识别的后处理阶段，本文将语言模型的先验信息和文字的视觉特征进行交互和增强，从而进一步提升文字识别的性能。

人工智能 EI企业智能图像处理深度学习

谷雨润一麦 2022-04-19 12:34:42

8955

2022-04-19 12:34:42

999+

CDistNet: Perceiving Multi-Domain Character Distance

本文提出通过位置编码，分别对视觉特征和语义特征进行对齐，避免了来自不同域的两个特征直接对齐所带来的困难，缓解了注意力偏移的现象。

谷雨润一麦 2022-04-19 11:53:41

8940

2022-04-19 11:53:41

999+

基于场景文字的多模态融合的图像分类

图像分类任务是计算机视觉最为基础的任务之一。依靠目标的细粒度、具有区分性的视觉特征能够较好地区分通用目标。然而，对于部分细粒度的类别，仅仅依靠视觉特征难以区分不同类别。

EI企业智能机器视觉深度学习

谷雨润一麦 2022-04-19 11:45:58

11870

2022-04-19 11:45:58

999+

论文解读系列三十：无参数的注意力模块SimAm论文解读

本文提出了一个概念简单但对卷积神经网络非常有效的注意力模块。相比于现有的通道注意力和空间注意力机制，本文直接在网络层中推理出三维的注意力权重而且不增加任何参数量。确切地来说，本文基于著名的神经科学理论提出了通过优化能量函数来查找每个神经元的重要性。

人工智能 EI企业智能 Image 机器视觉神经网络

谷雨润一麦 2021-11-22 16:13:23

10900

2021-11-22 16:13:23

999+

论文解读系列二十九：无监督视觉表征学习的动量对比

本文提出了一个用于无监督视觉表征学习的动量对比方法（MoCo）。从将对比学习作为字典查询过程的角度来看，本文构建了一个由队列和移动平均编码器组成的动态字典。这使得可以实时地构建一个巨大的并且具有一致性的字典，因此可以促进对比无监督学习。通过MoCo学习到的特征可以很好地在下游任务完成迁移。

人工智能 EI企业智能机器学习

谷雨润一麦 2021-11-16 16:20:16

9974

2021-11-16 16:20:16

999+

论文解读系列九：文字识别中基于Transformer识别方法之 SRN 简介

受Transformer模型的启发，目前一些学者将该结构应用到文本行识别中，以替代RNN，取得了良好的效果，如SRN。SRN使用了Transformer unit进行特征提取，并采用该文作者提出的并行解码器，整个模型拥有更好的可并行性。

人工智能 EI企业智能 Image OCR 机器视觉

谷雨润一麦 2021-08-27 16:43:13

14109

2021-08-27 16:43:13

999+

论文解读系列五：结合NLP的文本识别方法SEED (Semantics Enhanced Encoder-Decode)

当前主流的文本识别方法主要可分为两种，一种基于CTC的序列识别方法、另一种是基于注意力机制的序列识别方法，而当前针对文本识别的一些研究也是基于以上方法做改进，如尝试通过引入矫正网络来实现对于曲形文本序列的识别，但是这种基于矫正的改进方法无法处理模糊、部分遮挡等问题，本文尝试通过结合NLP的方法将语义信息引入基于注意力机制的序列识别方法来解决以上问题。

人工智能 OCR

谷雨润一麦 2021-08-27 16:41:54

12790

2021-08-27 16:41:54

999+

文字识别服务（OCR）基于对抗样本的模型可信安全威胁分析初析

文字识别作为计算机视觉的重要分支之一，面临着视觉方向同样的安全威胁分析。随着人工智能的普及和文字识别服务大规模的商业落地，解决好相关的模型安全威胁问题已经刻不容缓。

日志分析服务 Log

谷雨润一麦 2021-08-27 16:39:48

13734

2021-08-27 16:39:48

999+

总条数：25

100

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU

快速交付

+ 关注

	
		OSZAR »