Czy da się budować „AI fabryki” bez ryzyka, że jedna pomyłka w konfiguracji otworzy tylne drzwi do cudzego modelu i danych? NVIDIA twierdzi, że tak – i robi to nie firewallem, tylko warstwą bezpieczeństwa w samym kręgosłupie racka.
Czy naprawdę trzeba liczyć uwagę do każdego słowa w 128 tysiącach tokenów? NVIDIA twierdzi, że nie – i pokazuje, jak zrobić to szybciej, nie rozwalając modelu.
Ile razy widziałeś GPU ziewające w tle, gdy CPU mozolnie liczy listy sąsiedztwa atomów? Jeśli Twoje symulacje „AI-powered” w chemii i materiałoznawstwie jadą na hamulcu ręcznym, NVIDIA właśnie dorzuciła brakujący bieg.
Czy 60 ogłoszeń w rok to jeszcze kalendarz, czy już feed z dopalaczem? Jeśli śledzisz Google, 2025 był właśnie taki: co miesiąc nowy klocek, a z końcem roku – dość wyraźny obrazek tego, dokąd AI zmierza.
Czy naprawdę musimy liczyć uwagę każdego tokena do każdego innego tokena, tylko dlatego że tak mówi matematyka? NVIDIA twierdzi, że nie – i pokazuje, jak zrobić to sprytniej.
Czy da się wygrać wyścig o sztuczną inteligencję, nie machając czekiem na miliard dolarów? Lisa Su uważa, że tak – i mówi to z pewnością kogoś, kto już raz wyciągnął firmę z krawędzi.
Czy da się dogonić C++ wydajnością, pisząc w Pythonie – i to bez czarów, bez sugar-coata i bez tygodni czekania na kompilację? NVIDIA twierdzi, że tak: nowy CuTe DSL w CUTLASS 4 obiecuje „C++-owe” osiągi Tensor Cores z wygodą pythonowych API.