除了图像识别,cnn还被应用于自然语言处理、药物发现和围棋。
自然语言处理(NLP)是深度学习的另一个主要应用领域。除了谷歌翻译所解决的机器翻译问题外,主要的NLP任务包括自动摘要、共参考解析、篇章分析、形态分割、命名实体识别、自然语言生成、自然语言理解、词性标注、情绪分析和语音识别。
除了神经网络,神经语言处理的任务通常由递归神经网络(RNNs)处理,其中包括长短期记忆(LSTM)模型。正如我前面提到的,在循环神经网络中,神经元可以直接或间接地通过下一层影响自己。换句话说,RNNs可以有循环,这使它们能够在处理序列时保存一些信息历史——没有序列语言什么都不是。LSTMs是RNN的一种特别有吸引力的形式更强大的更新方程和更复杂的重复模块结构。
运行深度学习
不用说,深度CNNs和LSTMs通常需要强大的计算能力来进行训练。还记得谷歌大脑团队需要几千个gpu来训练新的人工智能版本的谷歌翻译吗?那不是玩笑。在一个GPU上花费3个小时的训练很可能需要30.在CPU上的时间。此外,GPU的类型也很重要:对于大多数深度学习包,你需要一个或多个兼容cuda的Nvidia GPU,这些GPU有足够的内存来运行你的模型。
这可能意味着你想要在云上进行培训:在撰写本文时,AWS、Azure和Bluemix都提供gpu实例,谷歌也将在2017年初提供。
虽然最大的云GPU实例的运行成本为每小时14美元,但也有更便宜的替代品。一个使用单一GPU的AWS实例的运行成本每小时不到1美元Azure批船厂它使用支持gpu的NC系列实例的深度学习食谱在计算池中运行您的训练,小型的NC6实例每小时收费90美分。
是的,你可以,也应该在自己的计算机上安装你选择的深度学习包学习之用,它是否具有合适的GPU。但是,当大规模谈到时间,火车模型,您可能不希望限制自己你碰巧在现场的硬件。
更深层次的学习
通过安装一个深度学习包、试用它的示例和阅读它的教程,您可以了解关于深度学习的很多内容。要了解更多,请考虑以下一个或多个资源:
- 神经网络和深度学习由迈克尔·尼尔森
- 神经网络简介大卫•克里塞尔(David Kriesel)著
- 深度学习,作者是Yoshua Bengio、Ian Goodfellow和Aaron Courville
- 机器学习的课程哈尔·道姆三世(Hal Daume III)著
- 的TensorFlow操场丹尼尔·斯迈尔科夫(Daniel Smilkov)和山·卡特(Shan Carter)著
- 斯坦福大学计算机科学类CS231n:用于视觉识别的卷积神经网络
相关文章
这个故事,“深度学习的真正含义”,最初发表于信息世界 。