{
“title”: “Claude API dobiva dvostruke limite izvan vršnih sati – dvotjedna akcija Anthropic-a”,
“content”: “
Anthropic, tvrtka koja stoji iza naprednog jezičnog modela Claude, najavila je privremenu promjenu u pravilima korištenja svog API‑ja. U razdoblju od dva tjedna korisnici će moći koristiti dvostruke limite izvan vršnih radnih sati. Ovaj potez smanjuje opterećenje servera, pruža veću fleksibilnost programerima i omogućuje prikupljanje podataka o stvarnom korištenju usluge.
\n
Zašto je potrebna veća dostupnost izvan vršnih sati
\n
U posljednjih nekoliko godina potražnja za umjetnom inteligencijom eksplodirala je. Veliki jezični modeli poput Claudea sve su popularniji među startupima, velikim poduzećima i samostalnim programerima. S porastom broja zahtjeva dolazi i do izazova u upravljanju resursima u oblaku. Tijekom radnog vremena – otprilike od 9 do 18 sati po pacifičkom vremenu – serveri Anthropic‑a bilježe najviši promet. To rezultira većim kašnjenjem odgovora i strožim ograničenjima, što može usporiti razvoj i narušiti iskustvo krajnjih korisnika.
\n
Umjesto da odmah povećavaju kapacitete, što bi bilo skupo i neodrživo, tvrtka je odlučila oblikovati potražnju. Poticajem na korištenje API‑ja izvan najprometnijih sati, Claude‑ova opterećenost se raspoređuje ravnomjernije kroz dan, a Anthropic dobiva vrijedne informacije o obrascima korištenja.
\n
Kako funkcionira dvostruko povećanje limita
\n
Tijekom dvotjedne akcije sve API ključeve koji nisu pod posebnim poduzećnim ugovorom podliježu sljedećim promjenama:
\n
- \n
- Vršni sati (9‑18 sati PT): osnovni limit ostaje 100 000 tokena po minuti.
- Izvan vršnih sati: limit se podiže na 200 000 tokena po minuti, što je dvostruko više od standardnog kapaciteta.
\n
\n
\n
Tokeni su osnovna jedinica koju Claude koristi za obradu i generiranje teksta – što je veći broj tokena, to duže i složenije upite model može obraditi u jednoj sekundi. Povećanjem limita izvan vršnih sati, programeri mogu slati veće zahtjeve, pokretati batch obradu podataka ili testirati nove funkcionalnosti bez straha od prekoračenja kvota.
\n
Koje su prednosti za developere i poduzeća
\n
Privremeno povećanje kapaciteta donosi nekoliko konkretnih koristi:
\n
- \n
- Brža iteracija: veći broj tokena po minuti omogućuje brže izvođenje testova i eksperimentiranje s modelom.
- Manje zastoja: izvan vršnih sati smanjuje se vjerojatnost da će zahtjevi biti odbačeni ili da će se pojaviti duža kašnjenja.
- Optimizacija troškova: korištenjem API‑ja u periodima s nižim opterećenjem moguće je izbjegavati dodatne troškove povezane s dinamičkim skaliranjem infrastrukture.
- Bolje razumijevanje obrasca korištenja: podaci prikupljeni tijekom ove akcije pomoći će Anthropic‑u da preciznije planira buduće kapacitete i eventualno ponudi nove pakete usluga.
\n
\n
\n
\n
\n
Savjeti kako iskoristiti proširene kapacitete
\n
Da biste maksimalno profitirali od dvostrukih limita, razmotrite sljedeće pristupe:
\n
- \n
- Planirajte batch zadatke izvan radnog vremena. Ako imate velike skupove podataka za obradu, rasporedite ih za večernje ili noćne sate.
- Isprobajte kompleksnije upite. Veći limit tokena omogućuje korištenje dužih konteksta i složenijih promptova, što može poboljšati kvalitetu generiranog teksta.
- Automatizirajte prebacivanje opterećenja
\n
\n