Das VLM macht in der Regel aus einer allgemeinen Anweisung („Reich mir mal den Kaffee rüber“) eine Reihe von Unteraufgaben – finde die Kaffeetasse, steuere den Greifer so, dass er die Tasse greifen ...
Some results have been hidden because they may be inaccessible to you
Show inaccessible results