mahome

  • 教育信息:哈尔滨工业大学
  • 擅长技能:NLP 文本分类 CNN RNN 机器学习 C++ python tensorflow
hiho统计
擅长技能
NLP 文本分类 CNN RNN 机器学习 C++ python tensorflow
教育经历
  • 哈尔滨工业大学 — 硕士

    计算机科学与技术学院

    2015 — 2018


  • 东北师范大学 — 本科

    计算机科学与技术学院

    2011 — 2015


工作经历
  • Work Application(ERP)上海(7 天) - 招聘实习工程师

    主要任务: 设计连锁书店管理系统,编写文档,根据 review,修改自己的功能。最后实现简单的 Demo。完成并 改善书籍销量预测、书籍位置摆放推荐的功能,实现了更加智能的书店管理系统。  使用方法: 使用线性回归模型,利用书籍销售数据等特征,构建具有高准确性和快速的反应速度特征的书籍销 量预测模型。使用频繁项集挖掘工具,通过挖掘高频书籍关联规则,实现了对书籍摆放的改善。

    2017.3 - 2017.4


项目经历
  • 2017.6-2017.8 知乎看山杯机器学习挑战赛(20/851)

    主要任务: 根据知乎问题标题与描述信息(脱敏),标签的描述消息,给知乎问题打上多个标签(multi-labels classification),标签全集数量为 1999,评测标准类似于 F1 值  方法: 1.根据词频过滤停用词与低频词,word2vec 训练词向量 2.用问题标题,描述消息的词向量的平均作为其句子的表示(fastText) 3.用问题标题(短文本),用 CNN 有不同长度的卷积核做句子表示(kim-text-cnn) 4.选取基于 simgmoid 激活的 binary-corss-entropy 为 loss, admgrad 为优化方法 5.应用的深度学习框架为 tensorflow

    2017.6 - 2017.8


  • 2016.6 - 2016.9 第五届全国社会媒体大会 SMPCUP 2016 技术测评第 1 名(Top 1%,1st / 197)

    主要任务: 通过用户的近期微博的文本数据与关注网络数据,预测微博用户的性别(二分类),年龄(三分类) , 地域(八分类),最终采用加权准确率作为评价指标。  方法: 有关文本数据:a). 使用卡方分析提取关键词,构造 BOW 特征;b). 利用微博文本,使用 Doc2Vec 技 术训练出用户的文档表示作为特征;c)应用 word2vec 训练词向量,CNN 提取句子表示向量。利用社 交网络关系,使用 Graph Embedding(LINE)技术训练用户的 Node Vector 作为特征。结合上述特征, 使用 SVM 作为基分类器,并采用 Stacking 技术进行模型融合,提高模型稳定性。有关地域分类问 题上,建立地域词典(多个行政级别),匹配微博文本消息,抽取地域字典匹配计数特征,结合用户网络信息进行分类。  主要负责模块: CNN 句子表示,地域分类问题

    2016.6 - 2016.9


获奖情况
  • 计蒜之道 2017 程序设计大赛复赛应届生 Top30(入围全国决赛) - top30

    2017.7


  • SMP CUP 2016 微博用户画像评测冠军(1/197) - 冠军

    2016.9


  • 哈尔滨工业大学一等奖学金 -

    2016.9


  • 2015 东北师范大学程序设计大赛冠军 -

    2015.5


  • ACM-ICPC 吉林省程序设计大赛金奖 -

    2013.3


  • 第 38 届 ACM-ICPC 亚洲区长沙赛区优胜奖 -

    2013.11