机器学习周刊:重视Python、机器学习、深度学习、大模型等硬核技能,每周日or周一更新
最近X上有推友重提这篇文章,是网友看过 Jeremy 教授的 fast.ai 深度学习课程后,把每节课说到的学习主张和劝告都总结了下来:
我让ChatGPT、Claude、Gemini翻译并总结了这篇文章,Gemini完结的更超卓,抽取了20条关于学习办法和一些细节的主张(强烈主张,假如时刻答应,可以看原文):
不要被理论吞没:专心于运转代码并对其进行试验,而不是一开始就堕入理论细节中。
挑选一个项目并把它做得精彩:挑选一个你感兴趣的项目,并投入额定的精力,保证对其来优化和改善。
探究不同的数据集:不要局限于课程中供给的数据集;自己寻觅数据集并对其进行试验。
学习 Jupyter 快捷键:了解 Jupyter 快捷键以进步你的功率。
运转代码并对其进行试验:不要只阅览代码;运转它并测验不同的输入和参数来查询会产生什么。
不要花几个小时企图当即了解一切理论:可以先不了解一切内容;专心于实践方面,并跟着时刻的推移逐步加深你的了解。
阅览竞赛获胜者的论文:经过阅览竞赛获胜者的论文来学习别人的成功经验,留意他们的办法和见地。
运用你具有的一切文本:在处理 NLP 时,保证运用一切可用的文本,包含未符号的验证集,以增强模型的功能。
非常习气 PyTorch 张量:培育对 PyTorch 张量和运算的厚实了解。
不要忧虑你是否跟上了一切内容:感到手足无措是正常的;专心于你能了解的内容,并逐步树立你的常识。
学会调试深度学习代码:调试 DL 代码具有挑战性;保证你的代码简略,并查看中心成果以最好可以下降过错。
慎重的数据增强: 在增强数据时,细心考虑转化及其对数据完整性和标签准确性的影响。
这个项目总结了生成式AI学习道路,从Python、机器学习、NLP、深度学习、GPT-4、Langchain、向量数据库、LLM项目布置,非常顺利。
有关自动学习、生物信息学、分类、衡量学习、蒙特卡罗、多臂、多视图学习等方面的查询、教程和书本的精选列表。
这个项目共享了各公司在生产中数据科学和机器学习方面的论文和技能博客,现已更新了3年。
怎么构架问题 (例如,将个性化视为引荐体系 vs. 查找 vs. 序列)
程序员Jiayuan (Forrest)在X上共享了开发者查找东西 devv.ai 是怎么构建RAG体系的进程,内容非常硬核。
Ollama为那些在macOS、Linux(暂不支撑Windows)上运用LLM的开发者供给了一种简洁的解决方案,可以更轻松地将这些模型集成到自己的使用程序中。
DreaMoving是一个依据分散模型的人类舞蹈视频生成结构。可以依据辅导序列和简略的内容描绘(仅文本提示、仅图画提示或文本和图画提示)生成高质量、高保真度的视频。
苹果发的这个论文《运用有限的内存完成更快的 LLM 推理》。经过将将模型参数保存在闪存里,依据本身的需求移动到DRAM。使得可以运转的模型巨细是可用DRAM的两倍,与传统的CPU和GPU加载办法比较,推理速度别离进步了4-5倍和20-25倍。
10、腾讯最新论文:《AppAgent: 多模态智能体,像实在用户相同操作手机》
论文经过引进一种依据大型言语模型(LLMs)的多模态智能署理(Agent)结构,赋予了智能体操作智能手机使用的才能。与传统的智能帮手如 Siri 不同,AppAgent 不依赖于体系后端拜访,而是经过模仿人类的点击和滑动等操作,直接与手机使用的图形用户界面(GUI)互动。这种共同的办法不只进步了安全性和隐私性,还保证了智能体能习惯使用界面的改变和更新。