NVIDIA prezentuje Skip Softmax – rewolucja w obliczeniach LLM!
Czy naprawdę musimy liczyć uwagę każdego tokena do każdego innego tokena, tylko dlatego że tak mówi matematyka? NVIDIA twierdzi, że nie – i pokazuje, jak zrobić to sprytniej.
Czy naprawdę musimy liczyć uwagę każdego tokena do każdego innego tokena, tylko dlatego że tak mówi matematyka? NVIDIA twierdzi, że nie – i pokazuje, jak zrobić to sprytniej.
A gdyby zamiast kupować gotowego chatbota, zbudować własny model klasy „frontier” – taki, który rozumie tylko wasz biznes, wasze dokumenty i wasze skróty myślowe? Amazon na re:Invent dowiózł dwa ruchy, które mogą to umożliwić: drugą generację modeli Nova (w tym warianty Lite i Pro) o…
Kto powiedział, że trenowanie gigantycznych MoE to przywilej firm z halą pełną GPU i sztabem od distributed systems na dyżurze 24/7? NVIDIA sugeruje, że ten rozdział właśnie się zamyka.