Warum wollen Tesla und Ideal nicht zugeben, dass sie „Autokonzerne“ sind?
Der großartige Regisseur James Cameron fungierte 2019 als Drehbuchautor und produzierte den Film „Alita: Battle Angel“. Der ursprüngliche Comic „Guangdong“ dieses Films stammt bereits aus dem Jahr 1991 Im Jahr 2000 gab es eine sehr fortschrittliche Situation: Die Bewohner des „Schrottplatzes“ am unteren Ende der Welt waren größtenteils modifizierte Menschen mit menschlichen Gehirnen und mechanischen Körpern, während die Bewohner in der utopischen Stadt „Zalem“ am oberen Ende der Welt lebten Die Welt „Den Bewohnern wurden als Erwachsene ihre Gehirne entnommen, ihnen wurden Chip-Gehirne implantiert, sie wurden von Supercomputern gesteuert, aber in menschliche Körper verwandelt.“
Abgesehen von Kampf- und Science-Fiction-Beschreibungen warf „Gunsheng“ eine Frage auf, die damals mysteriös schien: Wer ist eine reale Person, eine Person mit einem menschlichen Gehirn und einem mechanischen Körper oder eine Person mit einem mechanischen Gehirn und einem Menschen? Körper?
Sollten alle Unternehmen KI-Unternehmen sein? Alle Unternehmen können verkörperte Geheimdienstunternehmen sein!
Nachdem ChatGPT 3.5 und die große Modelltechnologie in der zweiten Hälfte des Jahres 2023 in den Fokus der Öffentlichkeit gerückt waren, riefen einige Leute auch einen Slogan: „Alle Unternehmen sollten KI-Unternehmen sein.“ Zukunft.
So haben wir im ersten Halbjahr 2024 unzählige Nächte menschlichen Aufruhrs erlebt. Jede neue Nachricht von OpenAI, Microsoft, Google oder Nvidia kann als Wendepunkt in der Geschichte interpretiert werden.
Dann entdeckten die Menschen, dass die Auswirkungen der KI auf die Welt offenbar nicht so gravierend waren, wie die Medien behaupteten.
Parallel zum rasanten Fortschritt der KI entsteht auch das Konzept der „verkörperten Intelligenz“, bei dem es sich ebenfalls um ein Konzept mit philosophischer, biologischer, Science-Fiction- und technologischer Bedeutung handelt.
Wir können „verkörperte Intelligenz“ auf diese einfache Weise verstehen: Verkörperte Intelligenz besteht darin, der Intelligenz einen Körper zu geben und das intelligente System mit dem Roboterkörper zu kombinieren, damit sie die Umgebung erkennen, die Umgebung verstehen und mit der Umgebung interagieren und handeln kann, um sie zu verkörpern Intelligenz.
In China, das über eine entwickelte Fertigungsindustrie verfügt, ist „verkörperte Intelligenz“ tatsächlich ein attraktiveres Konzept als KI und wird von der Öffentlichkeit leichter akzeptiert. Es ist auch ein KI-Technologieweg, der für chinesische Industrien besser geeignet ist.
Der Grund, warum ich so denke, liegt darin, dass ich nach der zweiten Hälfte des Jahres 2024, wenn die Branche ruhiger geworden ist, in vielen Interviews, die ich geführt habe, erwähnt habe, dass die zukünftige Entwicklungsrichtung meines Unternehmens verkörperte Intelligenz sein oder umfassen wird.
Interessant ist, dass es sich bei diesen Unternehmen nicht um Robotikunternehmen oder Unternehmen für künstliche Intelligenz im engeren Sinne der öffentlichen Wahrnehmung handelt, sondern um Automobilunternehmen, Drohnenautounternehmen oder Haushaltsgeräteunternehmen in den Augen der Öffentlichkeit …
Im August letzten Jahres führte Ai Faner ein Gespräch mit dem Ideal Intelligent Driving-Team, Lang Xianpeng, Vizepräsident für Forschung und Entwicklung von Ideal Intelligent Driving, beschrieb das intelligente Fahren der technischen End-to-End-Route als anders als das bisherige intelligente Fahren das auf der Logik „Wahrnehmung-Planung-Kontrolle“ beruhte. Der Unterschied zwischen „Fähigkeit und Funktion“.
Mit anderen Worten: Bringen Sie einem Mann das Angeln bei oder bringen Sie ihm das Angeln bei.
▲ Der zugrunde liegende Modellrahmen von End-to-End + VLM könnte der aktuelle universelle Rahmen für verkörperte Intelligenz sein
In Interviews wird das Kernteam von Li Auto Li Auto mit einem Roboter auf Rädern vergleichen und auch über die prototypische Anwendung verkörperter intelligenter Träger wie humanoider Roboter unter Verwendung des „End-to-End + VLM“-Frameworks sprechen.
Bei der Erforschung intelligenter Fahrtechnologien zum Überholen in Kurven haben Automobilhersteller den Beginn der verkörperten Intelligenz entdeckt.
Dann erschien Li Xiang, der Gründer von Ideal, Ende letzten Jahres in einem exklusiven Interview und brachte die Positionierung und Vision von Ideal direkt zum Ausdruck: Ideal ist ein Unternehmen für künstliche Intelligenz, das sich der Automobilisierung künstlicher Intelligenz und der Förderung der Inklusivität künstlicher Intelligenz verschrieben hat an jede Familie.
Wenn Sie auf die Veranstaltung zum Xiaopeng AI Technology Day 2024 geachtet haben, werden Sie auch feststellen, dass Xiaopeng das Banner der KI hochhält, auch den KI-Roboter Iron herausgebracht und strategische Leute für KI-Maschinen in eine wichtige Position gebracht hat, heißt es dass es ohne 50 Milliarden keinen guten KI-Roboter schaffen kann.
Ganz zu schweigen davon, dass Musk wiederholt betont hat, dass „Tesla ein KI- und Robotikunternehmen ist, nicht nur ein Autounternehmen“, und jeder muss das Gefühl gehabt haben, dass Musk das Interesse an den Geschäftsmodellen verloren hat xAI, TeslaBot und RoboTaxi+FSD.
▲ Abbildung 02
Sogar OpenAI, das als das orthodoxeste und reinste KI-Unternehmen gilt, kann auch ein Personal-Intelligence-Unternehmen sein. Zu den Investoren hinter dem KI-Roboterunternehmen Figure gehören Riesenunternehmen wie OpenAI, Microsoft und Nvidia. Figure 02, das in der zweiten Hälfte des letzten Jahres veröffentlicht wurde, wird als „die fortschrittlichste KI-Hardware der Welt“ bezeichnet und umfasst KI-Technologie multimodale KI-Funktionen, bereitgestellt von OpenAI.
Ganz gleich, ob es sich um Teslas TeslaBot, Xpengs Iron oder Figure 02 handelt, sie alle sind für den Einsatz in der Automobilwerkstatt konzipiert. Obwohl es eine Marketingkomponente gibt, veranschaulicht dies auch ihre Vision.
In vielen Unterabteilungen, beispielsweise bei XAG, das sich auf den Agrarbereich konzentriert, wird davon ausgegangen, dass verkörperte Intelligenz auch in der landwirtschaftlichen Produktionsphase der Landwirtschaft und Ernte eingesetzt werden kann. Beispielsweise verfügen große Baumwollfelder und Getreidefelder über große Erntemaschinen Bei der Apfelernte ist es für große landwirtschaftliche Maschinen schwierig, in Obstplantagen einzudringen, und die Ernte erfolgt hauptsächlich manuell. KI-Roboter mit der Fähigkeit, in komplexem und engem Gelände zu manövrieren, und Roboterarme sind für dieses Szenario genau das Richtige .
Cloud Whale, dessen derzeitige Hauptprodukte Kehr- und Wischroboter und Bodenschrubber sind, ist der Ansicht, dass die derzeitige Reinigung der häuslichen Umgebung nur flache Oberflächen, also die Reinigung des Bodens, abdeckt. Die Entwicklungsrichtung von Cloud Whale ist in Zukunft die Raumreinigung ist die Reinigung verschiedener Schreibtische und Arbeitsplatten. Wenn Sie den Raum reinigen möchten, benötigen Sie natürlich Fähigkeiten der künstlichen Intelligenz mit „visuellen Fähigkeiten“ als Kern sowie mehrdimensionale mechanische Strukturen, die auf der Grundlage von Kehr- und Wischrobotern entwickelt wurden.
▲Soror Saros Z70 Kehrroboter mit Manipulator
Zufälligerweise stellten die beiden Kehrroboterhersteller Roborock und Zhuimi auf dem CES-Flaggschiff 2025 Kehrroboter mit Roboterhänden oder bionischer Mehrgelenk-Roboterhandtechnologie vor. Kehrroboter sind lediglich Träger der Roboterhandtechnologie.
▲ Dysons Roboterhand bei der Demonstration der Hausarbeit
Zuvor hat Dyson auch Demonstrationsmaterialien für Roboter zum Reinigen von Häusern veröffentlicht. Grundsätzlich haben große Hersteller, die sich mit der Haushaltsreinigung befassen, darüber nachgedacht, die Hardware von Roboterarmen und KI-Fähigkeiten mit KI-Vision als Kern zu nutzen, um die einzigen Grenzen der Reinigung zu überwinden Der Boden ist verkörperte Intelligenz in der häuslichen Umgebung.
Obwohl der Satz „Alle Unternehmen können verkörperte Intelligenzunternehmen sein“ im Untertitel eine Art Schlagzeile ist, liegt die Bedeutung dieser Betonung darin, dass diese Gruppe von Unternehmen, die an verkörperter Intelligenz interessiert sind, nicht ganz weit von der Kommerzialisierung entfernt sind, nämlich Robotikunternehmen die der Spitzentechnologie sehr nahe stehen (wie Boston Robotics) und wahrscheinlich Unternehmen sind, mit denen wir täglich in Kontakt kommen. Sie verfügen über ausgereifte Geschäftsmodelle und Cashflows sowie eine große Investitionsbereitschaft in Technologie.
Dies ist auch eines der Anzeichen dafür, dass der technische Weg fortgesetzt werden kann: Konsens.
Viele beliebte Technologietrends wie AR/VR/XR, Metaverse, NFT usw. mögen sehr beliebt sein, aber der Konsens ist fragil. Jeder hat seine eigenen Ideen und Berechnungen. Es gibt keine Synergien und kein universelles Szenario.
▲Alita hat nicht einmal einen Schädel und umhüllt ihr Gehirn mit einer mechanischen Struktur. Das Bild stammt aus einem Standbild aus „Alita: Battle Angel“.
Dem Körper Intelligenz geben oder der Intelligenz den Körper?
„Gib der Zivilisation Zeit, nicht der Zivilisation“ ist ein universeller Satz. Genauso wie wir, wenn wir über verkörperte Intelligenz sprechen, auch darüber diskutieren müssen, ob wir „dem Körper Intelligenz geben sollen oder den Körper der Intelligenz?“
Wir können auch zur ursprünglichen Frage „Ein Traum von Waffen“ zurückkehren: „Wer ist eine echte Person, eine Person mit einem menschlichen Gehirn und einem mechanischen Körper oder eine Person mit einem mechanischen Gehirn und einem menschlichen Körper?“
Yao Qizhi, Gewinner des Turing-Preises, Akademiker der Chinesischen Akademie der Wissenschaften, Dekan des Instituts für Cross-Information an der Tsinghua-Universität und Gründer der weltweit führenden Computertalent-Wiege „Tsinghua Yao Class“, sprach auf der World Robot 2023 Konferenz und sagte:
Der Mensch selbst ist eine ideale verkörperte Intelligenz auf der Welt.
Es besteht im Wesentlichen aus drei Aspekten, drei Komponenten: Der erste Aspekt ist der Körper, der zweite Aspekt ist das Kleinhirn und der dritte Aspekt ist das Gehirn.
Teile des Körpers müssen über ausreichende Hardware mit Sensoren und Aktoren verfügen. Das Kleinhirn wird verschiedene visuelle und taktile Wahrnehmungen beherrschen, um den Körper zu kontrollieren und komplexe Aufgaben zu erledigen Die langfristige Verarbeitung kann mithilfe natürlicher Sprache mit anderen Agenten und der Umgebung kommunizieren.
Die dreifache Metapher aus Körper, Kleinhirn und Gehirn ist die branchenweit verständlichste Erklärung für „verkörperte Intelligenz“.
Verglichen mit der relativen Reife des Körpers ist die Reife des „Kleinhirns“ und des „Gehirns“ in der verkörperten Intelligenz bei weitem nicht ausreichend, insbesondere des „Gehirns“.
Als Modul, das für „Wahrnehmung-Begründung-Vorhersage-Aktion“ verantwortlich ist, besteht immer noch eine große Lücke zwischen den Gehirnfähigkeiten der verkörperten Intelligenz und der des Menschen, und auch die Forschung befindet sich im Anfangsstadium des Robotersteuerungssystems SayCan im Jahr 2022 und im folgenden Jahr wurde ein multimodales großes Modell PaLM-E mit 562B Parametern entwickelt, einschließlich eines visuellen Modells mit 22B Parametern.
▲ Einführung in PaLM-E
Der Fortschritt von PaLM-E besteht darin, dass der verkörperte intelligente Roboter Aufgaben autonom zerlegen, Aktionen ausführen und Aufgaben auf der Grundlage menschlicher Anweisungen in natürlicher Sprache erledigen kann, ähnlich wie ChatGPT, bei dem Ergebnisse auf der Grundlage von Eingabeaufforderungen generiert werden.
Darüber hinaus haben Organisationen wie Google und DeepMind auch Trainingsdatensätze für Roboter gesammelt, die 1 Million Clips abdecken und mehr als 500 Roboterfähigkeiten und 160.000 Aufgabenleistungen demonstrieren.
Li Feifei, ordentlicher Professor an der Stanford University und ehemaliger Chefwissenschaftler bei Google, hat kürzlich seinen Forschungsschwerpunkt auf räumliche Intelligenz verlagert und das Technologieunternehmen für räumliche Intelligenz World Labs gegründet, mit dem Ziel, das KI-Modell von einer 2D-Pixelebene auf ein vollständiges zu aktualisieren 3D-Welt (virtuelle und reale Welt), erstellen Sie Large World Models (LWM), um die 3D-Welt wahrzunehmen, zu generieren und mit ihr zu interagieren.
Vor der Gründung von World Labs leistete Li Feifei auch bedeutende Beiträge auf dem Gebiet der verkörperten Intelligenz. Der von ihr geleitete VoxPoser ist ebenfalls ein großes multimodales Modell der verkörperten Intelligenz mit starker visueller Intelligenz Verwandeln Sie Anweisungen in natürlicher Sprache in die Fähigkeit, bestimmte Aktionen auszuführen.
▲ Der von VoxPoser angetriebene Roboter umgeht die Vase und öffnet die Schublade
Wenn Sie dem Roboter beispielsweise sagen: „Öffnen Sie die Schublade, achten Sie auf die Vase“, umgeht der Roboter die Vase, um die Schublade zu öffnen.
Zwischen diesem Befehl in natürlicher Sprache und der letzten Aktion zeigt sich, dass der von VoxPoser unterstützte Roboter wissen kann, was eine Schublade und eine Vase ist, und dass er die Position der Schublade und der Vase im 3D-Raum erkennen kann „Sei vorsichtig“ und was ist die letzte Aufgabe… ….
▲ VoxPoser-Lauflogik
Das bedeutet, dass der Roboter Ohren, Augen, ein Gehirn und natürlich Hände hat. Das Gehirn versteht die von den Ohren gehörten Anweisungen und zerlegt sie dann in Aufgabenschritte. Anschließend weist das Gehirn die Augen an, eine „Karte“ räumlicher Informationen zu erstellen, und schließlich handeln die Hände entsprechend der „Karte“.
In solch einem komplexen Prozess interagieren das große Sprachmodell und das visuelle Modell im multimodalen großen Modell kontinuierlich, um Informationen wie Code für Abbauaufgaben, räumliche Informationskarten und Codes für die Ausführung von Aufgaben zu generieren.
Noch wichtiger ist, dass der Roboter kein Vortraining absolvierte, sondern die Aufgabe direkt erledigte. Dies ist der größte Unterschied zwischen verkörperter Intelligenz und früheren Robotern: Ob Roboterarme am Fließband oder tanzende Roboter auf der Party, sie Alle laufen nach festen Verfahren ab, haben nur eine Reihe von Verhaltensmustern und sind nicht in der Lage, Umweltinformationen zu verstehen und darauf zu reagieren.
Verkörperte Intelligenz, unterstützt durch große multimodale Modelle, wird auch „emergente“ Fähigkeiten hervorbringen. Wenn beispielsweise kein Vortraining stattfindet, wird der Roboter aufgefordert, die Hälfte der Schublade herauszuziehen, da der Roboter die Länge der Schublade nicht kennt Schublade im Voraus, also „halb“ Was es ist, ist für den Roboter unbekannt.
Doch so löst der Roboter das Problem: Zuerst die Schublade ganz herausziehen und dann zur Hälfte zurückschieben, was einem Herausziehen der halben Schublade gleichkommt.
Mit anderen Worten: Große multimodale Modelle wie VoxPoser verleihen der verkörperten Intelligenz die Fähigkeit zur „Verallgemeinerung“, das heißt, die verkörperte Intelligenz kann nicht nur eine Sache tun, sondern Schlussfolgerungen ziehen und viele Dinge tun.
Dies bringt uns zurück zu der zuvor erwähnten Frage, ob man den Menschen das Fischen beibringen soll oder ob man den Menschen das Fischen beibringen soll. Große End-to-End-Modelle sind so, als würden sie den Menschen das Angeln beibringen, und das Schreiben von Vorschriften bedeutet, den Menschen das Angeln beizubringen. Wenn multimodale große Modelle selbst Code generieren, beherrschen sie das „ Fähigkeit“ und Fähigkeiten können verschiedene „Funktionen“ erzeugen.
Die Demonstration von VoxPoser kann uns helfen, den signifikanten Unterschied zwischen verkörperter Intelligenz und verschiedenen früheren Robotern zu verstehen, und kann auch die Frage des Untertitels beantworten: Dem Körper Intelligenz geben oder dem Körper Intelligenz geben?
Natürlich erhält die Intelligenz einen Körper, und das Gehirn ist der Herr des Körpers.
Auch die Frage in „Gun Meng“ wurde beantwortet: Wer ist eine echte Person, eine Person mit einem menschlichen Gehirn und einem mechanischen Körper oder eine Person mit einem mechanischen Gehirn und einem menschlichen Körper? Natürlich ist es ersteres.
▲ Tesla hat einen eigenen Dojo-Chip und ein eigenes Dojo-System für das KI-Training entwickelt
PS und Intelligenz, Musk und MAGA
Philosophische und technische Fragen mögen weit entfernt und unklar sein, aber praktische Fragen werden immer bestehen.
Wenn ich darüber nachdenke, warum aktuelle Automobilhersteller so sehr auf KI und verkörperte Intelligenz setzen, dass sie ihre Identität als „Autohersteller“ aufgeben müssen, kommen mir einige Gedanken in den Sinn:
- Die Automobilproduktion ist die größte industrielle Produktionsaktivität und strebt stets nach der fortschrittlichsten Technologie, der höchsten Effizienz und der geringsten Abhängigkeit von menschlicher Fertigung.
- Auch das Streben nach intelligentem Fahren von Automobilen ist nicht auf den Menschen angewiesen.
- Früher waren Autos Produkte mit der höchsten PS-Leistung, die normale Menschen fahren konnten, heute sind es Produkte mit der höchsten Rechenleistung (Intelligenz), die normale Menschen besitzen können.
Teslas Fabrik in Shanghai ist eine der am stärksten automatisierten und effizientesten Fabriken in der Automobilindustrie. Natürlich ist sie möglicherweise auch eine der Automobilfabriken mit der geringsten menschlichen Beteiligung. Die meisten Produktions- und Montageprozesse werden von Maschinen durchgeführt.
▲Zeitgenössische Automobilproduktionslinie
Das Konzept der „Schwarzlichtfabrik“ erfreut sich auch in der Automobilindustrie großer Beliebtheit. Die sogenannte „Schwarzlichtfabrik“ bedeutet, dass keine menschliche Beteiligung erforderlich ist Hoher Grad an Automatisierung und Intelligenz. Eine Produktionslinie oder Fabrik, die ohne Beleuchtung arbeiten kann.
Als normale Menschen verstehen wir, dass es bei der „Verlassenheit“ des Autos eher um intelligentes Fahren geht. Es ist absehbar, dass das „Fahrverhalten“ in Zukunft immer seltener wird und sich immer weiter vom Alltag entfernt und weiter weg von Hobbys.
Wir können Autos auch aus einer anderen Perspektive als Produkt verstehen. Ob es sich um ein Produkt von Tesla oder Wei Xiaoli handelt, es kann als das Produkt mit der höchsten Leistung und der höchsten Intelligenz angesehen werden, das normale Menschen besitzen können.
Lange Zeit waren PS und Intelligenz getrennt. Autos verfügten zwar über viele Chips, aber die Mobiltelefone und Computer, die wir täglich nutzen, waren sehr zurückgeblieben. sowie das dahinter stehende Cloud Computing verfügen über eine gute Rechenleistung, aber nicht über Pferdestärken.
Heutzutage kann ein Flaggschiff-Elektroauto über Tausende PS und Dutzende Milliarden Transistoren verfügen.
Wenn Sie es aus dieser Perspektive betrachten, sind es jene Automarken, die Sensoren in Autos einbauen, um die Rechenleistung von Chips zu erhöhen, ihre eigenen Wanka-Trainingscluster aufbauen, um große Modelle herzustellen, und jene Automarken, die darauf bestehen, alte Unsterbliche des Strichzeichnens mit dem Zeichnen zu engagieren Die Gürtellinien ihrer Autos sind bereits völlig unterschiedlich.
Dann ist es für Ersteres zu vernünftig, sich selbst als „Unternehmen für künstliche Intelligenz und Robotik“ zu bezeichnen.
Kürzlich kam es in den sozialen Medien zu einer heftigen Konfrontation zwischen Musk und einigen fanatischen Unterstützern Trumps (sogenannte MAGA-Gruppe). Der Grund dafür war, dass die MAGA-Gruppe Arbeitsvisa für hochqualifizierte Talente ablehnte, weil sie glaubte, dass solche Visa Arbeitsplätze wegnehmen würden lokalen Talenten Chancen bieten und Außenstehenden großartige Beschäftigungsmöglichkeiten überlassen.
Musk, ein in Südafrika geborener Einwanderer, und sein anderer Einwanderer-Verbündeter widerlegten dies sehr direkt, auch wenn sie ihre eigene Abwehr durcheinanderbrachten und aufrüttelten:
- Ingenieurs- und technische Talente, die über legale Kanäle wie Arbeitsvisa für hochqualifizierte Talente eingeführt werden, sind sehr wichtig, genau wie die Nuggets der NBA den serbischen Athleten Jokic eingeführt haben.
- Die Kultur der amerikanischen Ureinwohner bevorzugt Partystars gegenüber wissenschaftlichem Talent, und anderswo ist das Gegenteil der Fall.
- Es sollten mehr High-Tech-Talente herangezogen werden, vorzugsweise verdoppelt.
Es gibt auch Hinweise auf ähnliche Verschwörungen. Einige Medien sagten beispielsweise, dass amerikanische Investoren eine Frage stellen würden, wenn sie ein Internet-Unternehmerteam aus dem Silicon Valley ohne chinesische Namen sehen würden:
In Ihrem Team gibt es keine Chinesen. Wer übernimmt also die Arbeit?
Wie das Sprichwort sagt: Lügen schaden nie, die Wahrheit ist die schärfste Waffe. Der Subtext von Musk und seinen Verbündeten ist, dass die MAGA-Gruppe nicht die Arbeit von High-Tech-Talenten erledigen kann und dass die Arbeit für kluge Leute ist.
Das ist eine der Wahrheiten, und die zweite Wahrheit ist, dass die in der MAGA-Gruppe konzentrierten mittelständischen Arbeiterjobs genau das sind, was Musk geplant hat.
▲ Roboter, die in Fabriken arbeiten, sind ein Marketing-Gag und ein unvermeidliches Szenario in der Zukunft.
In den Bereichen Fertigung, Logistik, Bauwesen, Lagerhaltung, Lebensmittelverarbeitung und anderen Bereichen sind derzeit zahlreiche gering qualifizierte und stark repetitive Positionen die Hauptbeschäftigungsmöglichkeiten für die MAGA-Gruppe. Diese Positionen wurden von vielen automatisierten Produktionslinien besetzt Die übrigen sind wahrscheinlich flexibler und werden wahrscheinlich auch durch verkörperte intelligente Roboter mit stärkerem Umweltverständnis und besseren Lernfähigkeiten ersetzt.
Wer erforscht also hauptsächlich diese verkörperten Intelligenzen? Ingenieurs- und technische Talente werden durch ein High-Tech-Talentvisum eingeführt.
Wenn der Gründer eines Unternehmens gleichzeitig enorme Pferdestärken und Intelligenz hervorbringen kann, fällt es ihm schwer, nicht darüber nachzudenken, diese beiden Kräfte einzusetzen, um schwache und komplexe Menschen zu ersetzen.
Unternehmer, die riesige Unternehmen geleitet haben, wissen sehr gut, wie schwierig es ist, Menschen zu führen, und wie einfach es ist, Roboter zu führen. Unternehmer, die an Technologie glauben und den Beginn von AGI sehen, werden KI natürlich nicht einfach nur auf dem Bildschirm anzeigen lassen.
Praktischere Frage: Warum brauchen wir verkörperte Intelligenz?
2024 wird kein gutes Jahr für japanische und deutsche Automobilunternehmen sein, denn einerseits sind die Marktanteile zurückgegangen, die Gewinne sind eingebrochen und die Produktionskapazitäten scheinen überflüssig zu sein, andererseits sind Produktionskapazitäten überflüssig, aber Arbeitskräfte „Es müssen weiterhin Löhne gezahlt werden, das gewinnorientierte Kapital wird natürlich über Entlassungen und Kostensenkungen nachdenken, aber in Deutschland, wo die Gewerkschaften stark sind, gibt es viele Schwierigkeiten.“
Im Vergleich zur Produktion eines Autos in China sind die Kosten für die Produktion eines Autos in Deutschland viel höher. Wenn die Wettbewerbsfähigkeit sinkt, sinkt der Anteil Da die Produktionskapazitäten nicht ausgeschöpft sind, werden die Kosten in Deutschland weiter steigen, weshalb Volkswagen plant, Fabriken in Deutschland zu schließen, Löhne zu kürzen und Mitarbeiter zu entlassen.
Nach langen Verhandlungen einigten sich Volkswagen und die Gewerkschaften darauf, das Werk nicht zu schließen, sondern bis zum Jahr 2030 35.000 Menschen in Deutschland zu entlassen.
Verkörperte Intelligenzen bilden keine Gewerkschaften, was ein großer Vorteil verkörperter Intelligenz ist.
Natürlich ist dies aus Kapitalperspektive.
Tatsächlich ist die Logik aus der Sicht der einfachen Leute eine ganz andere und die Schlüsselwörter sind dieselben: Arbeitskräfte.
Wenn Unternehmer auf verkörperte Intelligenz setzen, können sie davon ausgehen, dass ihre Belegschaft effizienter und kostengünstiger (Nutzungskosten und Verwaltungskosten) wird.
▲ Der Einsatz intelligenter Wasserventile in trockenen Gebieten kann die Wasser- und Arbeitskosten erheblich senken und die Verwaltung erleichtern
Wenn die Alterung unumkehrbar ist, wird es für uns vorhersehbar zu einem Mangel an Arbeitskräften in der Landwirtschaft, im verarbeitenden Gewerbe und im Dienstleistungssektor kommen. Intelligenz und verkörperte Intelligenz gelten in unseren Augen als eine der wirksamsten Lösungen vieler Unternehmer bzw. Unternehmer.
Sogar einige Unternehmer in der verarbeitenden Industrie beschweren sich darüber, dass junge Menschen eher bereit sind, Lebensmittel auszuliefern, als in Fabriken zu arbeiten. Der Grund dafür ist einfach, dass die Auslieferung von Lebensmitteln mehr Freiheit und höhere Einkommenserwartungen mit sich bringt und die Arbeit in einer Fabrik nicht teuer ist -wirksam.
Bezüglich des Prozesses, in dem verkörperte Intelligenz zur Arbeitskraft wird, sind sich alle einig:
- Kurzfristige, ToB-, Wissenschafts- und Bildungsforschung und andere Szenarien, experimentelle Lieferungen.
- Kurz- und mittelfristig wird ToB in Industrieszenarien implementiert. Im Vergleich zu herkömmlichen Industrierobotern ist die verkörperte Intelligenz nicht auf eine Art von Arbeit beschränkt geschickte Hände/Krallen/drei Finger. Bewegen und arbeiten.
- Mittelfristig, ToB, wird die Dienstleistungsszene menschlicher gestaltet und in der Lage sein, in den Bereichen Einzelhandel (Sortieren, Zählen), Hotel und Restaurant (Essensabholung, Lieferung) und Reinigung (Reinigung außerhalb des Flugzeugbetriebs) kompetent zu sein. und Inspektionsszenarien (Bürogebäude) Arbeit.
- Langfristig werden ToC- und Service-Szenarien implementiert, um emotionale Funktionen wie Kinderunterhaltung, Altenpflege und Begleitung von Erwachsenen sowie komplexe Bedürfnisse wie Haushaltsreinigung und -aufbewahrung zu erfüllen.
Was die Dauer anbelangt, sind sich alle Optimisten nicht einig, dass sie drei bis fünf Jahre beträgt, und die Konservativen gehen davon aus, dass sie mehr als zehn Jahre beträgt.
Was die verkörperte Intelligenz betrifft, gibt es viele Situationen zwischen Arbeitskräften und Unternehmern, und einige scheinen sogar widersprüchlich zu sein. Manchmal gibt es überflüssige Produktionskapazitäten und zu wenig Arbeitskräfte. Aber im Grunde ist es immer noch das gleiche Problem haben die Wahl. Tatsächlich mögen es Unternehmer nicht, Menschen als Arbeitskräfte einzusetzen, so wie kein Lehrer gerne Klassenlehrer ist und auch nicht gerne Subventionen hinzufügt.
▲ Die Stadt am Himmel ist Zalem, das Bild stammt aus den Standbildern von „Alita: Battle Angel“
In „Gunmen“ werden die Bewohner der utopischen Stadt „Zalem“, deren ursprüngliche Gehirne entfernt und ihnen Chip-Gehirne implantiert wurden, dann von Supercomputern verwaltet, was das Lieblingsmodell von Geschäftsinhabern ist.
Natürlich wird die Realität nicht so düster sein. Einerseits wird die Entwicklung von Menschen und Robotern tatsächlich so verlaufen, wie in „Gunsmen“ beschrieben, und zwar beginnend mit externen Maschinen Akzeptieren Sie dann einen gewissen Grad an Mechanisierung des Körpers, von Menschen mit Behinderungen und Krankheiten, die Maschinen verwenden, um ihre Körperfunktionen zu ergänzen, bis hin zu normalen Menschen, die Maschinen verwenden, um ihre Körperfunktionen zu verbessern.
Andererseits geht die Richtung der verkörperten Intelligenz natürlich in Richtung der Entwicklung intelligenter Gehirne und flexibler Körper wie der Bewohner von „Zalem“ sowie der Gehorsamkeit.
Die Komplexität und Fehlertoleranz der verkörperten Intelligenz ist jedoch nicht dasselbe wie bei der Erstellung eines ChatGPT. Große Sprachmodelle verfügen bereits über umfangreiche Internetdaten als Trainingserwartungen, die verkörperte Intelligenz erfasst jedoch keine Daten für 22 verschiedene Roboter Typen mit 1 Million Clips, die mehr als 500 Roboterfähigkeiten und 16 demonstrieren Die Bewältigung von Zehntausenden Aufgaben ist bereits Gegenstand des aktuellen Masterstudiengangs, doch die Datenmenge ist weitaus geringer als die Menge, die für ein hervorragendes ganzheitliches intelligentes Fahrtraining erforderlich ist, geschweige denn die Bewältigung komplexerer Szenarien.
Aber mehr oder weniger haben wir das Rätsel der verkörperten Intelligenz in Unternehmen wie OpenAI, Tesla, Nvidia, Ideal, World Labs, Yushu usw. gesehen.
# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.
Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo