Kiinalainen supertekoäly Manus yllättää maailman – mutta laiskottelee tehtävissä
|
12.03.2025
|
|
Maailman uusin ja puhutuin tekoälyagentti on täällä – ja se ei pelkästään keskustele, vaan ajattelee, tutkii ja toimii itsenäisesti. Kiinalaisen startupin kehittämä Manus on noussut hetkessä globaaliksi ilmiöksi, mutta sen matka täydellisyyteen ei ole ollut täysin mutkaton. Kuinka hyvin se suoriutuu vaativista tehtävistä? Testasimme sen itse – ja yllätyimme sekä sen nerokkuudesta että… pienestä laiskuudesta.
Kaikki tekoälypiireissä puhuvat Manusista. Me testasimme sitä.

Manusin suoritus muistuttaa älykkään mutta kiireisen harjoittelijan työtä: se osaa analysoida, hakea tietoa ja ehdottaa ratkaisuja, mutta toisinaan se tekee oletuksia, oikaisee mutkia tai jopa myöntää, että se ‘yritti nopeuttaa prosessia’. Tämä inhimillinen piirre tekee siitä yllättävän samaistuttavan – ja samalla paljastaa tekoälyn nykyisen rajallisuuden. Vaikka Manus kykenee itsenäisiin päätöksiin ja dynaamiseen ongelmanratkaisuun, se ei ole vielä täydellinen korvike ihmiselle, vaan ennemminkin tehokas työkalu niille, jotka osaavat ohjata sitä oikein.
|
|
Kiinalaisen yrityksen uusi yleinen tekoälyagentti kärsii järjestelmäkaatumisista ja palvelinruuhkista – mutta se on erittäin intuitiivinen ja näyttää lupaavalta tekoälyavustajien tulevaisuudelle.
Kirjoittanut Caiwei Chen
11. maaliskuuta 2025
Siitä lähtien, kun yleinen tekoälyagentti Manus julkaistiin viime viikolla, se on levinnyt verkossa kulovalkean tavoin. Eikä vain Kiinassa, missä Wuhanissa sijaitseva startup Butterfly Effect sen kehitti, vaan myös maailmanlaajuisesti. Sen suorituskykyä ovat kehuneet monet teknologiavaikuttajat, kuten Twitterin perustaja Jack Dorsey ja Hugging Face -yhtiön tuotepäällikkö Victor Mustar. Jotkut ovat jopa kutsuneet sitä “toiseksi DeepSeekiksi”, viitaten aikaisempaan tekoälymalliin, joka yllätti alan sekä kyvykkyydellään että alkuperällään.
Manus väittää olevansa maailman ensimmäinen yleinen tekoälyagentti. Se hyödyntää useita eri tekoälymalleja (kuten Anthropicin Claude 3.5 Sonnetia sekä Alibaba Qwenin hienosäädettyjä avoimen lähdekoodin versioita) ja useita itsenäisesti toimivia agentteja suorittaakseen tehtäviä autonomisesti. (Tämä erottaa sen AI-chatboteista, kuten DeepSeekistä, jotka perustuvat yhteen suureen kielimalliin ja ovat ensisijaisesti suunniteltu keskustelukäyttöön.)
Rajoitettu pääsy ja ensimmäiset kokemukset
Kaikesta hypestä huolimatta vain harvat ovat päässeet kokeilemaan Manusia. Tällä hetkellä alle 1 % jonotuslistan käyttäjistä on saanut kutsukoodin. (Ei ole tiedossa, kuinka moni listalla on, mutta Manusilla on jo yli 186 000 jäsentä Discord-kanavallaan.)
MIT Technology Review sai pääsyn Manusiin, ja testatessani sitä kokemus oli kuin työskentelisi älykkään ja tehokkaan harjoittelijan kanssa: vaikka se toisinaan ymmärsi tehtävän väärin, teki vääriä oletuksia tai oikoi mutkia nopeuttaakseen prosessia, se selitti aina päätelmiään selkeästi, sopeutui tilanteisiin ja paransi suoritustaan palautteen perusteella. Se on siis lupaava, mutta ei täydellinen.
Samoin kuin sen edeltäjä, vuonna 2023 julkaistu tekoälyavustaja Monica, myös Manus on suunnattu kansainvälisille käyttäjille. Sen oletuskieli on englanti, ja käyttöliittymä on pelkistetty ja selkeä.
Käyttäjän on syötettävä voimassa oleva kutsukoodi päästäkseen sisään. Sen jälkeen järjestelmä ohjaa käyttäjän aloitussivulle, joka muistuttaa ChatGPT:tä ja DeepSeekkiä: vasemmalla näkyvät aiemmat keskustelut, keskellä viestikenttä. Aloitussivulla on myös yrityksen valmiiksi määrittelemiä esimerkkitehtäviä, jotka liittyvät esimerkiksi liiketoimintastrategioihin, interaktiiviseen oppimiseen ja yksilöllisiin meditaatioharjoituksiin.
Kuten muutkin päättelyyn perustuvat tekoälyagentit (esim. ChatGPT DeepResearch), Manus osaa jakaa tehtävät vaiheisiin ja etsiä itsenäisesti verkkotietoa niiden suorittamiseksi. Se, mikä erottaa sen muista, on “Manusin tietokone” -ikkuna, joka antaa käyttäjälle mahdollisuuden seurata agentin toimintaa ja tarvittaessa puuttua siihen.
Kolme testitehtävää
Annoin Manusille kolme tehtävää:
Koota lista merkittävistä Kiinan teknologia-alan toimittajista. Etsiä New Yorkista kahden makuuhuoneen asuntoja tietyillä kriteereillä. Ehdottaa kandidaatteja MIT Technology Review’n vuosittaiseen Innovators Under 35 -listaan.
Tehtävä 1: Toimittajalista
Ensimmäinen listaus sisälsi vain viisi nimeä, joista viisi muuta mainittiin “kunnianosoituksena”. Huomasin, että Manus oli maininnut osan toimittajien tunnetuista töistä, mutta ei kaikille. Kun kysyin syytä, vastaus oli yllättävän rehellinen: se oli ollut laiska. “Osittain aikaongelmien vuoksi yritin nopeuttaa tutkimusprosessia”, se selitti.
Kun vaadin kattavuutta ja johdonmukaisuutta, Manus laati uuden listan 30 toimittajasta, lisäten heidän nykyiset työnantajansa ja merkittävimmät työnsä. Se myös korjasi nopeasti virheelliset työnantajatiedot, kun pyysin sitä tarkistamaan ne.
Manus kohtasi kuitenkin ongelmia maksumuurien kanssa, sillä se törmäsi usein CAPTCHA-tunnistuksiin eikä päässyt käsiksi kaikkiin artikkeleihin. Ominaisuus, jossa Manus osaisi pyytää käyttäjän apua näissä tilanteissa, olisi hyödyllinen tulevaisuudessa.
Tehtävä 2: Asuntojen etsiminen
Annoin Manusille useita kriteerejä, kuten budjetin, tilavan keittiön, ulkotilan, pääsyn Manhattanin keskustaan ja seitsemän minuutin kävelymatkan suurille asemille.
Aluksi Manus tulkitsi “jonkinlainen ulkotila” -kriteerin liian kirjaimellisesti, jättäen pois kaikki asunnot ilman parveketta tai terassia. Tarkennusten jälkeen se kuitenkin laajensi hakua ja antoi suosituksia eri kategorioissa, kuten “paras kokonaisuus”, “paras hinta-laatusuhde” ja “luksusvaihtoehto”.
Tehtävä 3: Innovators Under 35 -ehdokaslista
Tämä oli laajin tehtävä. Manus jakoi prosessin vaiheisiin: se tutki aiempia listoja ymmärtääkseen valintakriteerit, loi hakustrategian, etsi nimiä ja varmisti valintojen monipuolisuuden.
Hakustrategian kehittäminen vei eniten aikaa, ja Manus kävi läpi muun muassa arvostettujen yliopistojen verkkosivustoja, teknologiakilpailujen voittajia ja uutisartikkeleita. Se törmäsi jälleen ongelmiin maksumuurien kanssa, mikä hidasti prosessia.
Kolmen tunnin haun jälkeen se pystyi tuottamaan vain kolme ehdokasta täydellisin taustatiedoin. Kun vaadin täydellistä 50 hengen listaa, se lopulta laati yhden, mutta tietyt akateemiset instituutiot olivat yliedustettuja. Kun pyysin viittä ehdokasta Kiinasta, se pystyi tuottamaan ne, mutta tulokset painottuivat tunnettuihin mediapersooniin.
Johtopäätös
Manus on erittäin intuitiivinen ja sopii sekä koodareille että tavallisille käyttäjille. Kahdessa kolmesta testitehtävästä se tuotti parempia tuloksia kuin ChatGPT DeepResearch, mutta sen suorittaminen vei enemmän aikaa.
Se soveltuu parhaiten tehtäviin, joissa tarvitaan laajaa internet-tutkimusta mutta rajattua fokusta – toisin sanoen tehtäviin, jotka taitava harjoittelija voisi suorittaa päivän aikana.
Kuitenkin järjestelmäkaatumiset ja kapasiteettiongelmat ovat suuria haasteita. Manusin suorittamien tehtävien kustannus on vain kymmenesosa DeepResearchin kustannuksista, mikä voi tehdä siitä houkuttelevan vaihtoehdon yksityiskäyttäjille ja pienille yrityksille, jos sen infrastruktuuria parannetaan.
Lopulta Manusin vahvuus on sen läpinäkyvä ja yhteistyökykyinen toimintatapa. Se muistaa aiemmat ohjeet ja mukautuu käyttäjän tarpeisiin. Kiinalaiset tekoälyyritykset eivät vain seuraa länsimaisia malleja, vaan muovaavat autonomisten tekoälyagenttien kehitystä omalla tavallaan.
Lähde: MIT Technology Review
|
:
">Contact Us.
|
Tagit
ytt j n (4),
yleinen teko lyagentti (3),
mit technology review (3),
innovators under 35 (2),
eritt in intuitiivinen (2),
teht v (7),
ytt j (5),
ytt jille (3),
yleinen teko (3),
teko lyagentti (3),
technology review (3),
mit technology (3),
yll tt (2),
under 35 (2),
testiteht v (2),
Manus (13),
ytt (12),
teko (11),
teht (9),
mutta (9),
sen (7),
vain (6),
ovat (5),
oli (5),
kuten (5),
|
|