Pagsulay sa "Smartest sa Kalibutan" Grok3

AIPU Waton Group (1)

Pasiuna

Sa imong hunahuna ba ang GROK3 mao ang "katapusan nga punto" sa mga pre-bansay nga mga modelo?

Si Elon Musk ug ang xai team opisyal nga naglansad sa labing bag-ong bersyon sa GROK, GROK3, sa panahon sa usa ka livestream. Sa wala pa kini nga panghitabo, usa ka mahinungdanong kantidad sa mga may kalabutan nga kasayuran, inubanan sa 24/7 nga promosyon sa muska, gipataas ang global nga gipaabut alang sa Grok3 sa wala pa nabag-o nga lebel. Usa ka semana ang milabay, ang musk masaligon nga gipahayag sa usa ka livestream samtang nagkomento sa Deepsec R1, "ang Xai hapit na maglansad sa usa ka labing maayo nga modelo sa AI." From the data presented live, Grok3 has reportedly surpassed all current mainstream models in benchmarks for mathematics, science, and programming, with Musk even claiming that Grok3 will be used for computational tasks related to SpaceX's Mars missions, predicting "breakthroughs at the Nobel Prize level within three years." Bisan pa, kini karon mga gipahayag sa musk. Pagkahuman sa paglansad, gisulayan nako ang labing bag-ong bersyon sa Beta sa GROK3 ug gipangutana ang klasiko nga pangutana nga pangutana alang sa daghang mga modelo: "nga mas dako, 9.11 o 9.9?" Makasubo nga wala'y bisan unsang mga kwalipikado o marka, ang gitawag nga Smartest Grok3 dili gihapon makatubag sa kini nga pangutana nga husto. Ang GROK3 napakyas sa tukma nga pag-ila sa kahulogan sa pangutana.

 

Ang kini nga pagsulay dali nga nakakuha og daghang mga higala, ug managsama nga parehas nga mga pagsulay sa gawas sa nasud nga nakigbisog sa mga pangunang puwangyo sa mga landing nga Tower sa Pisa? " Sa ingon, kataw-anan nga gimarkahan kini nga "usa ka henyo nga dili gusto nga motubag sa yano nga mga pangutana."

640

Maayo ang GROK3 apan dili kini labi ka maayo kaysa R1 o O1-PRO.

Ang GROK3 nakasinati sa "mga kapakyasan" sa daghang mga pagsulay sa kahibalo sa Kinaugalingon nga mga pagsulay. Atol sa evai paglansad nga panghitabo, gipakita sa musk gamit ang GROK3 aron ma-analisar ang mga klase sa karakter ug mga epekto sa dula nga kanunay, apan kadaghanan sa mga tubag nga gihatag sa GROK3 dili husto. Ang musk sa panahon sa livestream wala makamatikod niining klaro nga isyu.

 

Kini nga sayup dili lamang naghatag dugang nga ebidensya alang sa mga netizen sa gawas sa nasud aron mabiaybiay ang musk sa "pagpangita sa usa ka kapuli" sa kasaligan usab sa praktikal nga aplikasyon. Alang sa ingon nga "genius," bisan unsa pa ang aktuwal nga katakus niini, ang kasaligan niini nga labi ka komplikado nga mga sitwasyon sa aplikasyon, sama sa mga buluhaton sa eksplorasyon sa Mars, nagpabilin nga pagduhaduha.

 

Karon, daghang mga tester nga nakadawat access sa grok3 nga mga semana ang milabay, ug kadtong gisulayan ra ang mga kapabilidad sa modelo sa usa ka gamay nga konklusyon: "Dili maayo kini kaysa R1 o O1-PRO."

640 (1)

Usa ka Kritikal nga Panglantaw sa "Nagdaugdaug nga Nvidia"

Sa opisyal nga gipresentar ang PPT sa panahon sa pagpagawas, ang GROK3 gipakita nga "FET sa unahan" sa Vertical Axis sa mga resulta sa mga resulta sa mga resulta sa pag-ayo sa kini nga presentasyon.

640

Sa tinuud nga mga resulta sa pag-iskor sa modelo, ang GROK3 mao ra ang 1-2% sa unahan sa Deepseceek R1 ug GPT-4.0, nga katumbas sa mga kasinatian sa mga tiggamit nga nakit-an nga "wala'y nakit-an nga kalainan." Ang GROK3 molapas lamang sa mga manununod niini pinaagi sa 1% -2%.

640

Bisan kung ang GROK3 nakapuntos nga mas taas kaysa sa tanan nga gisulayan sa publiko, daghan ang wala makuha kini nga seryoso: pagkahuman nga gisaway ang Xai alang sa "puntos sa pag-manipulasyon" Ingon nga gipahamtang ang leaderboard nga estilo sa Tubag sa Tubag, ang mga iskor nga mikunhod, ang nanguna nga mga insider sa industriya aron kanunay pagsaway sa katingad-an sa "taas nga abilidad."

 

Pinaagi sa leaderboard nga "manipulasyon" o laraw sa laraw sa mga ilustrasyon, gipadayag nila ang obsess sa evai ug musk sa ideya sa "nanguna sa mga kapabilidad sa modelo. Ang musk nagbayad sa usa ka matulin nga presyo alang sa mga margin: sa paglansad, gipasigarbo niya ang 200,000 H100 nga HPU (pag-angkon "sa usa ka oras nga pagbansay sa 200,000 nga oras. Kini ang hinungdan nga ang pipila nagtuo nga kini nagrepresentar sa lain nga hinungdanon nga boon alang sa industriya sa GPU ug gikonsiderar ang epekto sa Dreeseek sa sektor nga "binuang." Labi na, ang pipila nagtuo nga ang labi ka kusog nga pag-computate mao ang kaugmaon sa pagbansay sa modelo.

 

Bisan pa, ang pipila nga mga netizens itandi ang pagkonsumo sa 2000 H800 nga GPUS sa duha ka bulan aron makagama sa Deresteek V3, nga ang aktuwal nga konsumo sa pagbansay sa GROK3 mao ang 263 ka beses sa V3. Ang gintang tali sa Deepsheek V3, nga nakapuntos sa 1402 puntos, ug ang GROK3 naa sa ilalum sa 100 puntos. Pagkahuman sa pagpagawas sa kini nga datos, daghan ang dali nga nakaamgo nga ang titulo sa GROK3 ingon nga "labing lig-on nga mga modelo sa ut-ot nga mas lig-on nga nagpadagan nga mga pagbalik.

640 (2)

Bisan sa "taas nga pag-iskor apan ubos nga abilidad," ang GROK2 adunay daghang kantidad nga taas nga kalidad nga datos sa una nga partido gikan sa X (Twitter) platform aron suportahan ang paggamit. Bisan pa, sa pagbansay sa GROK3, ang xai natural nga nakatagbo sa "kisame" nga giatubang karon sa Openii - ang kakulang sa mga data sa pagbansay sa premium nga pag-atubang sa mga kapabilidad sa modelo.

 

Ang mga nag-develop sa GROK3 ug musk lagmit ang una nga nakasabut ug nagpaila sa kini nga mga kamatuoran, mao ang hinungdan nga ang Musk media nga nakasinati karon "pa ang beta" ug nga "ang bug-os nga bersyon nga buhian sa umaabot nga mga bulan." Gikuha sa musk ang papel sa tagdumala sa produkto sa GROK3, ang mga tiggamit naghatag og feedback sa lainlaing mga isyu nga nasugatan sa mga komentaryo.

 

Bisan pa, sa sulod sa usa ka adlaw, ang pasundayag sa GROK3 sa walay duhaduha nagpataas sa mga alarma alang sa mga naglaom nga magsalig sa "Base sa GPT-4 sa Pa-trilyon nga mga parameter sa Microsoft, nga adunay usa ka parameter nga mga parameter sa mga parameter sa Microsoft, nga adunay sukod nga mga parameter sa Microsoft, sobra sa mga parameter sa Microsoft, sobra sa napulo ka mga punoan sa Microsoft, nga adunay sukod sa Microsoft nga adunay mga parameter sa Microsoft, nga adunay usa ka sukod sa Microsoft nga adunay sukod sa Microsoft, sa napulo ka mga punoan sa Microsoft, sobra sa mga numero sa Microsoft, sobra sa 6 nga Trilter nga mga parameter, sobra sa napulo ka beses sa GPT-3. Gisugyot sa mga tsismis nga ang gidak-on sa parameter sa GPT-4.5 mahimong mas dako.

 

Ingon nga ang modelo nga parameter nga gidak-on mao ang pag-ayo, ang mga gasto sa pagbansay usab mga skyrocketing. Sa presensya sa GROK3 sama sa gpt-4.5 ug uban pa nga gusto nga magpadayon sa "nagdilaab nga salapi" aron mahibal-an ang kisamer nga klaro nga makita karon nga makita kini. Niining higayona, si Ilda Sutskever, kanhi punoan nga siyentista sa Openi, kaniadto giingon sa miaging Disyembre, "nga gipabilhan ang mga panaghisgot sa tinuud nga dalan alang sa pagbansay sa daghang mga modelo.

640 (3)

Ang panan-aw ni Ilya nagpalanog sa alarma sa industriya. Tukma nga nahibal-an niya ang hapit na maablihan nga bag-ong datos, nga nagdala sa usa ka kahimtang diin ang pasundayag dili mapadayon pinaagi sa pag-antos sa mga fossil fuels. Gipaila niya nga "sama sa lana, ang sulud nga gihimo sa tawo sa Internet usa ka limitado nga kapanguhaan." Sa mga panagna sa Sutskever, ang sunod nga henerasyon sa mga modelo, post-pre-training, makabaton sa "tinuud nga awtonomiya" ug mga katakus sa pangatarungan "nga susama sa utok sa tawo."

 

Dili sama sa mga modelo nga pre-nabansay sa una nga nagasalig sa sulud sa sulud (pinasukad sa una nga natun-an nga mga sistema sa modelo), pag-establisar ang mga pamaagi sa pagsulbad sa mga problema sa us aka "panghunahuna" sa utok sa tawo. Ang usa ka tawo makab-ot ang hinungdanon nga kahanas sa usa ka hilisgutan nga adunay sukaranang propesyonal nga literatura, samtang ang usa ka maayo nga modelo sa AI nanginahanglan lamang sa labing sukaranan nga lebel sa pagsulod sa lebel. Bisan kung ang mga pulong nga nausab gamay, kining mga sukaranan nga mga pangutana mahimong dili husto nga masabtan, nga naghulagway nga ang modelo wala pa matino nga mga pangutana nga gihisgotan sa sinugdanan sa kini nga panghitabo.

微信图片 _20240614024031.jpg1

Kataposan

Bisan pa, sa unahan sa kusog nga kusog, kung ang GROK3 molampos sa pagpadayag sa industriya nga ang "pre-bra-bra-ang mga modelo nagkaduol na sa ilang katapusan.

Tingali pagkahuman sa kabuang nga naglibot sa GROK3 anam-anam nga nahurot, makasaksi kami sa daghang mga kaso sa "Tuning High-Defery Models sa usa ka piho nga datus sa pag-ayo alang sa usa ka piho nga datus sa pag-ayo sa usa ka piho nga datus sa pag-ayo sa usa ka piho nga datus sa kantidad nga" Sa katapusan nga pagdiskubre sa tinuud nga dalan padulong sa AGI.

Pangitaa ang Solusyon sa Elv Cable

Kontrol nga mga kable

Alang sa BMS, bus, industriyal, instrumento sa instrumento.

Istruktura nga sistema sa cabling

Network & Data, fiber-optic cable, patch cord, mga module, faceplate

2024 nga mga pasundayag ug pagrepaso sa panghitabo

Abril.16th-18th, 2024 Middle-East-Energy sa Dubai

Abril.16th-18th, 2024 Securika sa Moscow

Mayo.9th, 2024 Bag-ong mga Produkto ug Mga Teknolohiya sa Pag-ilis sa SHACHOLIES sa Shanghai

Oktubre.2nd-25th, 2024 Security Security China sa Beijing

Nov.19-20, 2024 nga konektado sa Kalibutan nga KSA


Post Oras: Peb-19-2025