学习一下近期新兴的一个方向Graph Neural Network(GNN),从这篇2018年清华发表的科普类文章开始
My first RL-related paper
Posted on
|
Post modified:
Words count in article:
3.9k
这是关于论文的笔记。
该论文设计了一个具有层次结构的SDN,以及一个基于RL的进化式路由算法QAR(Qos-aware Adaptive routing)。用到的东西不是很新奇,但是在当时也许相当于开创了一个领域。
QAR使用SARSA算法,使用Qos设计Reward函数。
为了进行仿真,复现论文中的结果,为此学习了Omnet++框架,并且自己手搓了SDN网络协议。
Reinforcement Learning Note (2)
Posted on
|
Post modified:
Words count in article:
2.9k
Reinforcement Learning: An Introduction 学习笔记(2)
A Simple Interpreter
Posted on
|
Post modified:
Words count in article:
662
使用Python实现的简单函数绘图语言的解释器。
本解释器分为词法分析、语法分析、语义分析三个部分。其中语法分析使用递归下降子程序的方法实现。
在各个步骤之间都有输出中间结果。
Reinforcement Learning Note (1)
最近尝试着入门强化学习,原因有二:一是自之前在Andrew的访谈视频中了解到强化学习,似乎这是最贴近人类学习方法的算法,于是十分感兴趣。二是想看一看这是否是一个值得自己选为未来方向的课题。
本文从强化学习的概念出发,到过去几十年常用的算法如Q-learning,再到目前的各种应用,主要目的是为了形成一个对强化学习的认识。主要的参考资料是《Reinforcement Learning: An Introduction》。
Improving: Hyperparameter tuning, Regularization and Optimization
Posted on
|
Post modified:
Words count in article:
1.9k
本文用于记录吴恩达deeplearning.ai系列的第二节课,涉及的内容包括调参、正则化、优化。