"ポリシーの学習プラットフォーム"の翻訳 英語に:


  辞書 日本-英語

ポリシーの学習プラットフォーム - 翻訳 :

  例 (レビューされていない外部ソース)

これでエージェントが学習したポリシーと 最適ポリシーの差が分かります
I've also graphed, with a dotted line, the policy loss.
最適ポリシーを学習していれば ポリシーの損失は下がってゼロになります
What does that mean? so that's the difference between the policy that the agent has learned and the optimal policy.
そして40回辺りで 何か重要なことを学習しました そこで得た最終ポリシーを学習したのです
It was high, up here, and then at around step 40, it learned something important.
よさそうなポリシーにとらわれて 他の学習を行わないからです
Because it was Greedy, it found something that seemed to be doing good for it, and then it never deviated from that.
受動学習が同じポリシーに 忠実であるという事実から問題は生じます ここにΠ s のポリシーがあり
And they all stem from the same cause, from the fact that passive learning stubbornly sticks to the same policy throughout.
これを用いて学習を続けます 最初に得たポリシーが無効なら
Now we have a new policy, and we continue learning with that new policy.
しかし船長のポリシーは変えられません それが受動的学習です もう一方は能動的強化学習といいます
You learn, and remember what you've learned, but that doesn't change the captain's policy and that's passive learning.
学習
Learning
学習
Learn
それを知らなくても固定されたポリシーを 実行している間に学習します
But it learns about the reward function, R, and maybe the transition function, P, if it didn't already know that.
アルファベットの学習Comment
Learn The Alphabet
評価や解決方法の理解は深めました 固定されたポリシーを示すπの効用を学習し
If we don't know what the MDP is, we know how to estimate it and then solve it.
プラットフォーム
Platform
学習です 次の
So, that's it for Unsupervised
アリの学習センターか
A center for ants?
学習アルゴリズムを見てきた 教師有り学習の中では それぞれの学習アルゴリズム同士のパフォーマンスは
By now, you see the range of different learning algorithms.
君は学習したから 船のポリシーの変更を認めよう 次に向かう場所を決定してよろしい
Okay I'm going to hand over control and as you learn, I'm going to allow you to change the policy for this ship.
デフォルトのポリシー
Default Policy
オフラインキャッシュのポリシー
Offline Cache Policy
地理学学習プログラムComment
A Geography Learning Program
既に見た 学習アルゴリズムおよび 今後の授業で学ぶ学習アルゴリズムを
Octave, in which you'll be able to very quickly implement the the learning algorithms we've seen already, and the learning algorithms we'll see later in this course.
ポリシー
Policies
ポリシー
Policy
つまり元の位置の方向に戻ります この受動的に固定されたポリシーに従った 強化学習エージェントが
And if we did end up here, then we'd immediately head back towards the road, so we'd aim back down in this direction.
プラットフォームComment
Platform
プラットフォームP.
Platform B.
プラットフォームだ!
They're on the platform!
南米の学習者は
Students may display captions in their native language.
学校の補習だよ
Hey, hey, hey. What happened to you?
学習する事も出来るし 聞き取りも学習出来るし 感触の処理も学習出来る 数学を
The brain can learn to see process images than to hear, learn to process our sense of touch.
機械学習の分野の
One final note
この学習の過程で
Whatever you put in front of them, they'll take statistics on.
このポリシーが
but the insurance company aren't silly people. They're very ughh scrutinize probabilities.
地理学習プログラム
A geography learning program
学習が速い
I mean they have much larger vocabulary.
学習成果ゼロ
Did not learn anything.
ハーバード大学で 英語学の学位を習得し
I don't look like a typical domestic violence survivor.
少し外のプラットフォーム
Th' carriage is waitin' outside for thee. A brougham stood on the road before the
学習者は学習しながら価値を生んでいるので
So this is how we could monetize this.
テストセットに送る前に ここに 学習アルゴリズムと回帰の学習の訓練を
Before you know sending the first 70 in the training set and the last 30 of the test set.
学習者は数学との関わりや
Basically, no one's very happy.
汎用カード ベースの学習プログラム
Generic card based learning program
Java ポリシー
Java policy
JavaScript ポリシー
JavaScript policy
それを学習アルゴリズムに読み込ませます 学習アルゴリズムの仕事は
We saw that with the training set like our training set of housing prices and we feed that to our learning algorithm.

 

関連検索 : 学習プラットフォーム - オンライン学習プラットフォーム - ポリシーの練習 - プラットフォームの化学 - 化学プラットフォーム - 学習の - 学習 - 学習 - 学習 - 入学ポリシー - ポリシー文学 - 学習習慣 - 習得学習 - 学習習慣