"私たちのポリシーです"の翻訳 英語に:


  辞書 日本-英語

私たちのポリシーです - 翻訳 :

  例 (レビューされていない外部ソース)

このポリシーは 虚勢と見なされがちですが
Now, one way of dealing with this problem is by deterrence.
これでエージェントが学習したポリシーと 最適ポリシーの差が分かります
I've also graphed, with a dotted line, the policy loss.
それは 私どものポリシーに反します
That's not our policy, sir.
デフォルトのポリシー
Default Policy
オフラインキャッシュのポリシー
Offline Cache Policy
それぞれ状態に向かうのは 0回ということです 私たちがやるのはポリシーの実行です
And the table of numbers, we're going to start at zero, saying we visited each state a total of zero times.
注目すべきはポリシーです
They happen to be 1000 for the two obstacles.
ポリシー
Policies
ポリシー
Policy
私たちのポリシーはよいものに見えます そしてここで手にします 0です ここで0を手にします
So, again, we have a zero and let's say our policy looks like a good one, so we get here, we have a zero.
ポリシーの指示に従うからです 偶然こちらの状態に外れても ポリシーに従って何もしません
If we tried to go up from this state because that's what the policy said but, stochastically, we slipped over to this state then we wouldn't do something else, according to the policy and so we'd get a little bit of exploration, but we'd only vary from the chosen path because of that variation and we wouldn't intentionally explore enough of the space.
このポリシーが
but the insurance company aren't silly people. They're very ughh scrutinize probabilities.
これが対応するポリシーです
After conversions for this grid, I want the value function to look just like this.
Java ポリシー
Java policy
JavaScript ポリシー
JavaScript policy
システムトレイの表示ポリシー
Policy for showing the system tray icon
ポリシーの出す指示が最良ではないので
And secondly, we could get a bad utility because our policy was off.
1 サンプルもしくはポリシーの どちらかのエラーが
I want you to tell me, is it True or False each of these statements
標準ポリシー
Default Policy
重複ポリシー
Duplicate Policy
送信ポリシー
Send policy
ドメイン固有の JavaScript ポリシー
Domain Specific JavaScript Policies
切り替えのポリシー
Switching Policy
あとはポリシーを実行するだけです
Let me set the initial state to be x, y, and orientation.
ポリシーの表の をチェックすることで分かります ポリシーの表には R Lがありますが その他は前回と同様です
While I haven't reached the goal state quite yet as indicated by checking for the star in my policy table.
すでに獲得した最良のポリシーに一定時間従い
Now, one possibility is, certainly, random exploration.
ドメイン固有ポリシー
Domain Specific Policies
不正なポリシー
Bad policy
従って点線で表したポリシーの損失は
And it's converging to much better results.
ポリシーはこのようになります
I'm closing up the wall over here, opening the wall down here, run it.
私たちは普通です私たちは普通です私たちは普通です 私たちは普通です私たちは普通です
This is really, in fact, a television broadcasting a show 24 7 called We're Normal.
あなたは準備ができているときはいつも... ...私たちはあなたのポリシー あなたの記録の終了のコピーを持っています
Whenever you're ready we have copies of your policy termination for your records.
ポリシーの指示は 1に進め なので
like starting in this state and the policy says,
全体設定のポリシーを使用します
Use setting from global policy.
最適ポリシーを学習していれば ポリシーの損失は下がってゼロになります
What does that mean? so that's the difference between the policy that the agent has learned and the optimal policy.
新しい Java ポリシー
New Java Policy
Java ポリシーを変更
Change Java Policy
新しい JavaScript ポリシー
New JavaScript Policy
JavaScript ポリシーを変更
Change JavaScript Policy
ポリシーを上書き
Overwrite Policy
それが俺のポリシーだよ
That's my policy.
Π S というポリシーを見つけてみましょう それが答えです 最適ポリシーであるΠは
Now to solve an MDP, we're trying to find a policy pi of S that's going to be our answer.
期間 20 年のポリシーを持っています
I have mortgage and I have young child and I want to make sure that if anything were to happen to me over the next...
ポリシーを適用します するとポリシーが 動く方向を教えてくれます ここで報酬を手にします
So we'll start at a start state, we'll apply the policy and let's say the policy tells us to move in this direction.
私たちの原点は星です 私たちは星くずなのです
So we literally are all made out of stardust.

 

関連検索 : 私たちのポリシー - 私たちのポリシー - 私たちのポリシー - 私たちです - 私たちのポリシーを表示 - 私たち私たちの - 私たちの中で - 私たちの庭で - 私たちのアパートで - 私たちのキャンパスで - 私たちのプライムで - 私たちの力で - 私たちの靴で - 私たちの庭で