-
哈尔滨工业大学 — 硕士
计算机科学与技术学院2015 — 2018
-
东北师范大学 — 本科
计算机科学与技术学院2011 — 2015
-
Work Application(ERP)上海(7 天) - 招聘实习工程师
主要任务: 设计连锁书店管理系统,编写文档,根据 review,修改自己的功能。最后实现简单的 Demo。完成并 改善书籍销量预测、书籍位置摆放推荐的功能,实现了更加智能的书店管理系统。 使用方法: 使用线性回归模型,利用书籍销售数据等特征,构建具有高准确性和快速的反应速度特征的书籍销 量预测模型。使用频繁项集挖掘工具,通过挖掘高频书籍关联规则,实现了对书籍摆放的改善。
2017.3 - 2017.4
-
2017.6-2017.8 知乎看山杯机器学习挑战赛(20/851)
主要任务: 根据知乎问题标题与描述信息(脱敏),标签的描述消息,给知乎问题打上多个标签(multi-labels classification),标签全集数量为 1999,评测标准类似于 F1 值 方法: 1.根据词频过滤停用词与低频词,word2vec 训练词向量 2.用问题标题,描述消息的词向量的平均作为其句子的表示(fastText) 3.用问题标题(短文本),用 CNN 有不同长度的卷积核做句子表示(kim-text-cnn) 4.选取基于 simgmoid 激活的 binary-corss-entropy 为 loss, admgrad 为优化方法 5.应用的深度学习框架为 tensorflow
2017.6 - 2017.8
-
2016.6 - 2016.9 第五届全国社会媒体大会 SMPCUP 2016 技术测评第 1 名(Top 1%,1st / 197)
主要任务: 通过用户的近期微博的文本数据与关注网络数据,预测微博用户的性别(二分类),年龄(三分类) , 地域(八分类),最终采用加权准确率作为评价指标。 方法: 有关文本数据:a). 使用卡方分析提取关键词,构造 BOW 特征;b). 利用微博文本,使用 Doc2Vec 技 术训练出用户的文档表示作为特征;c)应用 word2vec 训练词向量,CNN 提取句子表示向量。利用社 交网络关系,使用 Graph Embedding(LINE)技术训练用户的 Node Vector 作为特征。结合上述特征, 使用 SVM 作为基分类器,并采用 Stacking 技术进行模型融合,提高模型稳定性。有关地域分类问 题上,建立地域词典(多个行政级别),匹配微博文本消息,抽取地域字典匹配计数特征,结合用户网络信息进行分类。 主要负责模块: CNN 句子表示,地域分类问题
2016.6 - 2016.9
-
计蒜之道 2017 程序设计大赛复赛应届生 Top30(入围全国决赛) - top30
2017.7
-
SMP CUP 2016 微博用户画像评测冠军(1/197) - 冠军
2016.9
-
哈尔滨工业大学一等奖学金 -
2016.9
-
2015 东北师范大学程序设计大赛冠军 -
2015.5
-
ACM-ICPC 吉林省程序设计大赛金奖 -
2013.3
-
第 38 届 ACM-ICPC 亚洲区长沙赛区优胜奖 -
2013.11