-
SIF句向量
核心论文A SIMPLE BUT TOUGH-TO-BEAT BASELINE FOR SENTENCE EMBEDDINGShttps://openreview.net/pdf?id=SyK00v5xx简介 提出了一个无监督的句子建模方法,并且给出了该方法的一些理论解释。通过该方法得到的句子向量,在STS数据集上取得了不输给神经网络的效果。句子建模算法 作者将该算法称之为WR。 W表示Weighted,意为使用预估计的参数给句中的每个词向量赋予权重。 R表示Removal,意为使...…
-
工程能力 Bug定位与软件质量保证
Redis:用于缓存内存数据库,存储不同种类多数据; 工程中:存储用户的上下文 一问一答的业务问答 缓解数据库的压力,提高并发 本身用C语言写git官网上有实现Slave: 备胎,同步数据Sentinel: 哨兵,监管master高可用数据都是通过冗余实现的存在问题 如何判断master挂了 如何从slave中选 如果保持数据一致性缓存击穿:很多查找都没有找到,会使得数据库的负载变高,首先要知道在不在缓存内,然后去查找,缓存击穿是查不到数据导致请求走到了数据库。不隆过滤器作用...…
-
office相关操作
字体相关选中要成为上标的文字,ctrl+shift+“=”选中要成为下标的文字,ctrl+“=”…
-
Overview of SIGHAN 2014 Bake-off for Chinese Spelling Check
Overview of SIGHAN 2014 Bake-off for Chinese Spelling CheckChinese spelling checkers are relatively difficultto develop, partly because no word delimitersexist among Chinese words and a Chinese wordcan contain only a single character or multiplech...…
-
Nlp 08 深度学习的前沿
Batch 是对一个batch里面的词向量做归一化…
-
Nlp 07 如何处理时序问题 Rnn
RNN概览LSTM 使用加法,解决梯度消失加入选择门一个点乘操作加入遗忘门如果信息不停加,最后会导致进入饱和区,训练不了名字来源GRULSTM简化版GRURNN训练teacher forcing 在训练的时候,用上了正确的标签结果,见图片中序号1 好处:第一个预测错了,不影响第二个 在训练时,用上了预测的结果,见图片中序号2 区别:序号1的训练更快,一般训练用的是第一种方式,计算一样,只是decoder,输入不一样 推理的时候,只...…
-
Academic listening
快速提高口语:报一个考试,最快frenzy 狂热托福绿宝书纽约客比经济学人难。纽约客需要有文化。,经济学人是文学类的TED 上听AI类的背单词,大量重复每天坚持用英语写日记田间小站,这个网站有经济学人的平行文本rick & morty老友记现代爱情…
-
01 academic reading
难度: GRE难度词典欧陆词典灵格斯四维 L:listening R: reading W: writing S: speaking英文学习的输入和输出input: Reading + Listeningoutput: Speaking + WritingEconomist, NewYoker, Times, WSJ, education, bad blood,收集单词时,相应的句子记录下来3s版本 把未来看作熔炉的观点是错的Tentative: 实验性的单词积累背 读...…
-
Nlp 06 如何处理区域性问题 Cnn
Froward and backward propagationsSGDTraining scheme and some training tipsSome terminologies Epoch Iteration Hyperparameters ParametersL1: 会使得选择更加稀疏L2:不会那么稀疏Convolutional Neural Networks What is CNN.PoolingTraining tips Some Famous C...…
-
Nlp 项目一
[TOC]1 项目简介 新闻文本摘要自动生成2 环境依赖 Python3.6 Flask1.1.1 Jieba 其他:bootstrap、js、ajax、3 目录结构描述 data: 存放模型数据,维基百科词典 img: 项目相关图片截图 static: 存放css和js文件 template: 存放index.html app.py: 服务器端启动入口 extract_news.py: 新闻数据各部分内容提取 gensim_test.py: 训练词向量 proc...…
-
Nlp 05 Word2vec
一个词变成概率,使用softmax频率越高的词,放在卡前面,路径上面是sigmoid 函数x: 频率解决一词多义的问题…
-
Nlp 04 深度学习初探
Bias: 衡量误差Variance: 方差,表示稳定…
-
Nlp 01 人工智能数据基础 概率与统计
人工智能数据基础-概率与统计目录概率是什么古典概型&几何概型条件概率&联合概率期望&方差&协方差二项分布高斯分布中心极限定理泊松分布贝叶斯先验分布&后验分布机器学习分类指标相关截图疑问 概率函数 概率密度函数题目协方差为正,数学好的时候,物理可能也好,反之亦然总结 破解生活中一些不正确的直觉…
-
Nlp 03 模型评估
简介 朴素贝叶斯朴素贝叶斯 基于历史信息 , 有一种假设 用于做决策: 告诉你特征features,得出决策\(f(feature)\) \[p\]k 近邻算法 小范围,计算特别快(其他:二叉查找法),大范围很慢 实现简单存在问题 存储空间 速度 异常值…
-
Ai数学基础笔记
计算机基础导论为什么需要数学?人类如何表示数字?计算机如何对数字进行处理? 由逻辑电路组成 计算机并非无所不能 会无限循环 答案是相等的人工智能需要的数学知识微积分基础(导数)线性代数基础(矩阵)概率&统计基础(随机变量)图论(图的概念)推荐系统,会用图的结构表示,然后去分析,遍历等总结…
-
Nlp 02 搜索
搜索方法广度sous深度搜索BFS:满足cost>=0条件下,是达到全局最优场景搜索优化A*机器学习简介优化(梯度下降方法)线性回归总结…
-
论文阅读与写作
内容 Guide2research http://www.guide2research.com/ 按H排,一个计算公式 计算机学会目录 https://www.ccf.org.cn/xspj/gyml/ Arrive 内容会很新,有邮件推荐 dblp https://www.semanticscholar.org/ 替代版的谷歌学术 Scihub 下载SCI用的 ...…
-
环境工具安装
mac修改pip源参考网址 https://www.jianshu.com/p/f771e1120003实战conda一些具体操作参考网址 https://www.jianshu.com/p/d2e15200ee9b…
-
conda&pip安装常见问题
问题(tf) [root@GS04 WEAN]# conda install allennlpCollecting package metadata (current_repodata.json): doneSolving environment: failed with current_repodata.json, will retry with next repodata source.Collecting package metadata (repodata.json): doneS...…
-
Deep Recurrent Generative Decoder for Abstractive Text Summarization
简介 提出了一个新的端到端,面向对象的框架,叫做DRGN模型…