web reading
2018-11-20
数据标注|人工智能背后的人
之前有了解过ImageNet有过巨大的标记成本, 找了些资料看了看, 这篇文章的信息量还是非常巨大的, 无论是从人工智能的技术角度, 还是社会角度, 都有所涉及.
人工智能技术
人工智能技术还存在着许多的痛点与挑战, 这篇文章就从数据标注这个角度讲了讲.
- 数据标注的成本巨大
- 数据标注的质量参差不齐
因此, 也引发了如何解决数据标注的问题
- 小标记数据如何学习
- 迁移学习
- 半监督学习
- 无监督学习
- 数据增强
- 对于标注质量的参差不齐如何提升模型的性能
社会角度
数据标注的工作人员一般为生活在社会的底层, 然而这部分工作也是付出了血汗, 但是反馈并不高的行业, 如何解决这样的社会问题, 是需要投入更多教育, 让弱者也能更轻松的工作.
2018-10-30
Five Interview Questions to Predict a Good Data Scientist
想找数据科学
的相关岗位, 看看招聘者是如何总结的.
- 要么有较高的文聘, 要么有特定领域有多年的经验.
- 有较好的编码能力.
- 对机器学习的基础知识有较好的掌握.
- 对数据科学的热情, 是否参加过比赛, 会议发言, 写书或文章.
- 方法论的形成, 失败后的总结.
- 对新问题的数据建模问题.
2018-10-26
https://weibo.com/1402400261/GEmL0cQoc
- 𝒎𝒊𝒏 𝑮 𝒎𝒂𝒙 𝑫 𝔼𝒙 [𝒍𝒐𝒈 𝑫 (𝒙))] + 𝔼𝒛 [𝒍𝒐𝒈(𝟏 − 𝑫(𝑮(𝒛)))]
- GANs: 最小的生成误差, 最大的判别误差
- awesome GANs!!!😄
2018-10-18
博士五年之后五年的总结(其一)
$技术, 感悟
经验的积累, 方法的总结至关重要. 作为毕业五年的优秀毕业生, 他都有些什么感悟呢?
读什么东西,就成为什么样的人。
在日积月累之下,做或者不做这些,会让每个人最终成为不一样的人。
所以多看点动脑的内容,就不会让大脑生锈。做科研一个比较好的地方是工作本身并不重复,而是一直在开拓边界,这样自然会有更多的动脑时间。在闲暇时间,我经常会多看知乎上做数学和物理的同学们的回答,最好有几个不懂的名词需要自己去查去想想,手机上有个刷Arxiv的app经常看看,看一看一些优秀的github代码,也会动手刷刷题。
作者从多个角度总结了自己的经验
- 选方向?先要控制自己阅读的入口
- 如何选方向
- 如何抓紧时间
- 如何坚持一个长期的方向
作者的文笔是相当不存的, 简单而充实.
另外, 还有其他的后续的几篇, 值得阅读
2018-11-15
曾经买了一本精要主义, 当然这本书中很多方法都是有效的, 不过主要还是在于吸收与执行.
如果只是读过而没有实践, 那么一切都是徒劳的大白话而已.