Synonyms 是一个中文近义词工具包,它可用于如文本对齐、推荐算法、相似度计算、语义偏移、关键字提取、概念提取、自动摘要、搜索引擎等很多自然语言理解 (NLP) 任务。该工具包目前能搜索近义词和比较语句相似度等任务,且词汇量达到了 125,792。该中文近义词工具包采用的基本技术是 Word2vec。
kukeng66754 发布的最新帖子
-
开源中文近义词工具包Synonyms
-
基于Python 的拍照做题程序mathAI
mathAI 是一个拍照做题程序。输入一张包含数学计算题的图片,输出识别出的数学计算式以及计算结果。整个程序使用 Python 实现,具体处理流程包括了图像预处理、字符识别、数学公式识别、数学公式语义理解、结果输出。
目前上传的版本只能处理简单的一维加减乘除算术表达式(如果想要识别更加复杂的表达式,可以参考数学公式识别的论文)。可以参考的代码是前面字符识别部分以及整个算法处理框架。本程序使用 opencv 对输入的图像进行预处理,并将字符裁剪出来再归一化成固定大小的矩阵。对于数学公式的识别,主要是将识别出的独立的字符组织成计算机能够 理解的数学公式(这里的数学公式就是纯字符的可求解的数学计算题)。大概的方法是使用编译原理的算符优先法和递归下降法进行实现。 然后根据属性文法的值传递思想,将数学公式的值计算出来。最后使用 python 的 matlibplot 库把计算过程和答案打印出来。
-
优点:这是一整套拍照做题的算法框架,同时能够处理多种多样的计算题。OCR 技术如此成熟的今天字符识别已经不算有挑战的东西了。
-
缺点:字符空间关系判断只用了人类启发式规则,图像预处理不够鲁棒,数学公式的结构识别算法不够完美(可以考虑使用二维文法来做)。 系统还有很大的提升空间。
-
-
一些只有程序员能get到的点
1、某猿退休后决定练习书法,于是重金购买文房四宝。一日,饭后突生雅兴,一番研墨拟纸,并点上上好檀香。定神片刻,泼墨挥毫,郑重地写下一行字:hello world!
2、一程序员去面试,面试官问:“你毕业才两年,这三年工作经验是怎么来的?!”程序员答:“加班。”
3、女朋友对着正在写代码的程序猿男朋友说:你又在写bug啦?
4、《c++程序设计语言》比《c程序设计语言》厚了几倍...果然有了对象就麻烦很多...
5、 问:如何在Linux下生成随机串?答:让新手退出Vim。
6、一对程序员情侣在一起的时候干什么?答:面向对象编程。
7、 问:怎么使用面向对象的方式变得富有 ?答:继承。
8、 程序猿的必读书籍: 第一阶段:《C语言程序与设计》《c++进阶宝典》《Swift入门与实践》 第二阶段:《教你怎么不生气》《老子》《沉默的愤怒》 第三阶段:《女装指南》 第四阶段:《颈椎病康复指南》《腰椎间盘突出日常护理》《强迫症的自我恢复》 第五阶段:《活着》
9、一个女程序员twitter上发了一条tweet:昨晚梦见男朋友和别的女人在逛街,梦里我的第一反应是查源代码…结果调试半天查不出来为什么显示的是那个女人不是我,最后含泪把那个女人给注释掉了,再一运行就是我男朋友自己逛街了…醒来囧字脸呆了很久…囧rz
10、为什么程序员总是搞混万圣节和圣诞节?因为 Oct 31 = Dec 25。(Oct既是十月October缩写,也是八进制Octal的缩写;Dec既是十二月December的缩写,也是十进制Decimal的缩写。八进制的31和十进制的25相等。) -
www.fontke.com 一个好用的字体转换网站
直接上图,免费,好用不卡机,适合处理较大的字体文件,百度的字体编辑器处理大字体的时候时不时会出现卡死的情况,如果是纯转换,可使用这个工具
-
RE: input placeholder 字体颜色
核心代码
input::-webkit-input-placeholder { color: #ff6300; } input::-moz-placeholder { /* Mozilla Firefox 19+ */ color: #ff6300; } input:-moz-placeholder { /* Mozilla Firefox 4 to 18 */ color: #ff6300; } input:-ms-input-placeholder { /* Internet Explorer 10-11 */ color: #ff6300; }
兼容性
-
MVVMFrame组件化方案MVVMFrameComponent
MVVMFrameComponent 是基于 MVVMFrame 框架为核心基础库构建的组件化方案,主要使用的核心技术有JetPack、Dagger、DataBinding、Retrofit、OkHttp、Glide、Kotlin coroutines和ARouter等。
组件化简单概括就是把一个功能完整的 App 或 模块 拆分成多个子模块, 让每个子模块可以独立编译和运行, 也可以作为 library 合并到宿主App组成一个完整的 App进行编译和运行。每个模块即可以不相互依赖,又可以相互交互。
当一个App使用组件化开发方案时,主要的优势有:组件化拆分各个模块后,每个子模块都可以独立编译和运行,这样在开发调测某个模块时,可以大大提高编译速度和开发效率。多人开发时,每个人负责独立的模块,更有利于多人团队协作开发。并且各个模块之间的代码边界相对清晰,更易于后期维护。