硬核科普|深度学习主流开发框架解读和比较(中篇)
专题推荐:金博士AI技术干货分享
文章推荐:硬核科普|深度学习主流开发框架解读和比较
本文的知识点
(资料图)
通过本文,读者可以从中学习和掌握的关键知识点,包括:
1. 深度学习框架:了解不同的深度学习框架,如PyTorch、TensorFlow和Keras,并理解每个框架的特定优势和使用场景。
2. 每个框架的技术细节:了解每个框架的技术规格,如所用的编程语言、操作的API级别,以及架构类型
3. 性能比较:理解这些框架在性能上的差异,如速度和处理大数据集的能力,例如Keras适合较小的数据集,而PyTorch和TensorFlow适合处理大数据集并提供高性能。
4. 如何选择合适自己或行业的框架:学习在选择深度学习框架时应考虑的因素,如数据集的大小和类型、可用性的模型集,社区支持以及部署相关的流程和工具等。
大应用对开发框架的要求
PyTorch 和 TensorFlow 都有其独特的开发历程和复杂的设计决策历史。之前,这使得比较两者变得是一个关于它们当前特点和未来特点的复杂技术讨论。鉴于两个框架自从创立以来都已迅速成熟,许多这些技术差异现在已经不再重要。
幸运的是,对于那些不希望听得昏昏欲睡的人来说,当前的 PyTorch 与 TensorFlow 的争论主要围绕三方面实践所需考虑的因素:
1. 模型可用性:随着深度学习领域的逐年扩大和模型相应地变得更大,从零开始训练最先进的模型已经不再可行。幸运的是,现在有许多最先进的模型公开可用,使用它们在可能的地方很重要。
2. 部署基础设施:如果训练出的性能良好的模型不能被利用,那训练它们就没有意义。降低部署时间至关重要,尤其是随着微服务业务模型越来越受欢迎;高效的部署有可能决定许多以机器学习为中心的业务的成败。
3. 生态系统:深度学习不再只是在高度控制的环境中的特定用例。AI正在为众多行业注入新的能量,因此,一个位于更大生态系统中的框架,可以为移动设备、本地和服务器应用程序提供开发支持变得很重要。此外,专用机器学习硬件的出现,如 Google 的 Edge TPU,意味着成功的实践者需要使用能够与这种硬件很好地集成的框架。
我们将依次探讨这三个实际考虑因素,然后提供我们对在不同领域使用哪个框架的建议。
模型可用性比较
从零开始实现一个成功的深度学习模型可能是一项非常棘手的任务,特别是对于如 NLP 这样的应用,其中工程和优化都很困难。SOTA(State-of-the-Art,最新的、最先进的)模型日益复杂,这对于小规模企业来,模型训练和微调都不太实际,甚至近乎不可能。初创公司和研究人员都没有计算资源来自己利用和探索这样的模型,因此,能够使用预训练模型进行迁移学习、微调或开箱即用的推理就显得非常宝贵了。
在模型可用性方面,PyTorch 和 TensorFlow 有着明显的差异。PyTorch 和 TensorFlow 都有自己的官方模型仓库,我们将在下面的生态系统部分探讨,但实践者可能希望使用其他来源的模型。
我们下面从三个维度来比较模型可用性:1)在 HuggingFace 上公开的模型所支持的框架类型数量, 2)出版的科研论文其研究所基于的框架类型, 3)基于网站 Paper-with-Code,对提供代码的论文所采用的框架类型进行统计分析。
HuggingFace
HuggingFace 是一家领先的人工智能公司,致力于开发和提供一流的自然语言处理(NLP)技术。它是名为Transformers库的开发者,该库是一个开源项目,提供了各种最新的深度学习模型,如BERT、GPT-2、GPT-3和T5等,供研究人员和开发者使用。这些模型广泛应用于文本分类、信息抽取、语义理解、自然语言生成等任务。
HuggingFace的Transformers库是NLP领域的一个重要资源,提供了丰富的预训练模型和相关工具,帮助开发者和研究人员简化开发过程,快速实现各类NLP任务。此外,Transformers库也是一个活跃的社区,研究者和开发者可以在其中相互学习,分享知识和经验。
除了Transformers库,HuggingFace还提供了一个在线模型库,用户可以在其中找到、分享和使用各种预训练模型。此外,HuggingFace还开发了一些其他工具,如Datasets库,这是一个开源的数据集库,用于处理和加载各种NLP数据集。总的来说,HuggingFace是推动当前NLP领域发展的重要力量,为研究和应用提供了极大的便利。
HuggingFace可以让你只用几行代码就将训练有素、调整优化过的 SOTA 模型纳入你的开发流程中。
当我们比较 HuggingFace 对 PyTorch 和 TensorFlow 模型的可用性时,结果有点令人惊讶。下面我们看到的是在 HuggingFace 上可用的模型总数的图表,这些模型要么仅限于 PyTorch 或 TensorFlow,要么适用于两种框架。可以看到,只能在 PyTorch 中使用的模型数量绝对压倒了竞争对手。几乎有92% 的模型仅支持 PyTorch,比2022 年的 85% 还要多。相反,只有大约 8% 的模型仅支持 TensorFlow,所有可用模型中只有大约 14% 支持 TensorFlow ,比2022年的 16%还要少。此外,2022 年新增了超过4.5 万个仅支持 PyTorch 的模型,而只增加了约 4 千个仅支持 TensorFlow 的模型。
图 1 HuggingFace 上的模型数量
如果我们把注意力集中在 HuggingFace 最受欢迎的 30 个模型上,我们会看到有趣的结果。所有模型都可在 PyTorch 中使用,和去年一样,没有任何模型只支持 TensorFlow。不过同时支持两种框架的模型数量已经从 19 增加到 23。
图 2 HuggingFace 上排名前 30 的模型
研究论文
关键词:
相关阅读
-
硬核科普|深度学习主流开发框架解读和比...
专题推荐:金博士AI技术干货分享文章推荐:硬核科普|深度学习主流开发 -
2023登封市区公办初中划片和报名指南
为保障市区义务教育学校招生入学工作顺利进行,经研究,现就2023年市区 -
开封各县区医保局、医保中心地址及咨询电话
开封市各县区医保局、医保中心地址及咨询电话市医保中心办公地址:郑开 -
三国之姜邓斗智8
三国之姜邓斗智8,28 狄道解了围,王经接邓艾、陈泰进城,道了谢,大赏 -
“我们相处得像一家人”
8月5日中午,定兴县天宫寺镇孙各庄村饭菜飘香,因汛情从小朱庄镇常家 -
襄阳城区首家“水电气”共享营业厅在襄...
襄阳城区首家“水电气”共享营业厅在襄城揭牌---8月8日上午,湖北省... -
合肥入学为什么查验小朋友们的预防接种证?
合肥入学为什么查验小朋友们的预防接种证?答:校园人口密集且相对封闭 -
【孝昌网评大赛㊺】东湖评论:擦亮小城...
【孝昌网评大赛㊺】东湖评论:擦亮小城镇,缔造“梦里老家”---近4... -
投资有信心 创新有恒心 转型有决心—...
山东省工商联等单位日前发布的《2023山东民营企业100强分析报告》显示 -
2023青岛海潮宇宙音乐节志愿者公布大名...
公布大名单时间:2023年8月11日工作时间&地点培训时间:2023年8月24日 -
浙江衢州柯城区教育局通报“幼儿园游泳...
央视网消息:据“柯城教育”公众号消息,8月7日,针对网传“珍维幼... -
中国A股游戏板块周一逆势上涨
中国A股游戏板块周一逆势上涨 -
我为群众办实事|小区顶楼铁架年久失修残...
8月3日,市民拨打华商报24小时新闻热线029-88880000反映,西安市碑林区 -
为什么杂粮可以降低心血管疾病?哪些食...
为什么杂粮可以降低心血管疾病?哪些食物才能算作“杂粮”? -
古都西安:后备箱集市丰富夜间生活
下午五点半,太阳仍然悬在天空,映射出灞河的粼粼波光。微风携带着热腾 -
2023沈阳皇姑有礼购车油礼消费补贴活动...
2023沈阳皇姑有礼购车油礼消费补贴活动开始时间及结束时间:开始时间: -
兰州地铁4号线线路规划图(持更)
兰州轨道交通4号线规划图(更新至2023年)根据百度地图显示:一期站点 -
大S起诉张兰汪小菲 法院已立案 自称长...
自从大S和汪小菲离婚,和具俊晔结婚后,这两家人之间的闹剧就没有停止 -
许尚龙:一位青年创业者的创业经历和成...
1 引言许尚龙是一位年轻有为的创业者,他在创业的路上走过了很多弯路, -
医保必须缴满一年才能报销吗?
以深圳为例:一 医保必须要缴满一年才能报销吗?我的社保到现在只交了