目录

web reading

2018-11-20

数据标注|人工智能背后的人

之前有了解过ImageNet有过巨大的标记成本, 找了些资料看了看, 这篇文章的信息量还是非常巨大的, 无论是从人工智能的技术角度, 还是社会角度, 都有所涉及.

人工智能技术

人工智能技术还存在着许多的痛点与挑战, 这篇文章就从数据标注这个角度讲了讲.

  • 数据标注的成本巨大
  • 数据标注的质量参差不齐

因此, 也引发了如何解决数据标注的问题

  • 小标记数据如何学习
    • 迁移学习
    • 半监督学习
    • 无监督学习
    • 数据增强
  • 对于标注质量的参差不齐如何提升模型的性能

社会角度

数据标注的工作人员一般为生活在社会的底层, 然而这部分工作也是付出了血汗, 但是反馈并不高的行业, 如何解决这样的社会问题, 是需要投入更多教育, 让弱者也能更轻松的工作.

2018-10-30

Five Interview Questions to Predict a Good Data Scientist

想找数据科学的相关岗位, 看看招聘者是如何总结的.

  1. 要么有较高的文聘, 要么有特定领域有多年的经验.
  2. 有较好的编码能力.
  3. 对机器学习的基础知识有较好的掌握.
  4. 对数据科学的热情, 是否参加过比赛, 会议发言, 写书或文章.
  5. 方法论的形成, 失败后的总结.
  6. 对新问题的数据建模问题.

2018-10-26

https://weibo.com/1402400261/GEmL0cQoc

assets/web/1540515458325.png

  • 𝒎𝒊𝒏 𝑮 𝒎𝒂𝒙 𝑫 𝔼𝒙 [𝒍𝒐𝒈 𝑫 (𝒙))] + 𝔼𝒛 [𝒍𝒐𝒈(𝟏 − 𝑫(𝑮(𝒛)))]
    • GANs: 最小的生成误差, 最大的判别误差
  • awesome GANs!!!😄

2018-10-18

博士五年之后五年的总结(其一)

$技术, 感悟

经验的积累, 方法的总结至关重要. 作为毕业五年的优秀毕业生, 他都有些什么感悟呢?

读什么东西,就成为什么样的人。

在日积月累之下,做或者不做这些,会让每个人最终成为不一样的人。

所以多看点动脑的内容,就不会让大脑生锈。做科研一个比较好的地方是工作本身并不重复,而是一直在开拓边界,这样自然会有更多的动脑时间。在闲暇时间,我经常会多看知乎上做数学和物理的同学们的回答,最好有几个不懂的名词需要自己去查去想想,手机上有个刷Arxiv的app经常看看,看一看一些优秀的github代码,也会动手刷刷题。

作者从多个角度总结了自己的经验

  • 选方向?先要控制自己阅读的入口
  • 如何选方向
  • 如何抓紧时间
  • 如何坚持一个长期的方向

作者的文笔是相当不存的, 简单而充实.

另外, 还有其他的后续的几篇, 值得阅读

2018-11-15

assets/web/1542267006411.png

[LINK]

曾经买了一本精要主义, 当然这本书中很多方法都是有效的, 不过主要还是在于吸收与执行.

如果只是读过而没有实践, 那么一切都是徒劳的大白话而已.