DQN 系列算法-DQN 进化之路
本篇介绍基于价值的深度强化学习算法 DQN 与该系列算法的不断改进之路。
本篇介绍基于价值的深度强化学习算法 DQN 与该系列算法的不断改进之路。
本篇博客介绍 Git 的基本使用,争取按规范的使用 Git 使开发流程更加规范。
最近代码中碰到许多网络相关问题,借此机会整理一下 http/https 协议相关的知识。
解决 微星 Z690 pro-a wifi 主板的 ubuntu 系统下 wifi 驱动问题。
强化学习领域的基础概念多,易混淆,记不清的话很容易对之后学习造成影响,因此本篇用来整理强化学习的基本概念。
这次作业的信息量突然变得很大,真正想做到 strong baseline 的话避不开去读 transformer , conformer 的论文。并且实现 ppt 里的几点提示:Self-attention pooling,Additive margin softmax,模型改为 conformer。
因此本篇文章用来整理自己从这个作业里学到的一些训练技巧,和调包流程。
本来是打算跳过这个作业的,结果发现后面的作业 4 self-attention 和本次作业相关性非常大。为了保证后边作业的顺利完成,加深对这个数据集的理解,所以继续将改作业做完。
以下是本次作业的实验记录。
本篇记录自己在做李宏毅机器学习 2020 作业 4 中所涉及的 NLP 相关基础知识。
简要总结了对词嵌入模型的理解。
博客内容如题,记录自己比较欠缺的 linux 基础知识。包括一些常用的 linux 系统指令,文件结构,系统权限等相关知识。
本篇文章用于记录 hugo 博客部署过程。
文章内容包括服务器配置,github 配置,以及网络配置,记录并保存 hugo 部署流程中用到的各种指令。