Pět expertů varuje: útočné techniky proti AI systémům se posunuly za prompt injection

30.6. 2026

Virtuální panel bezpečnostních odborníků shrnul aktuální stav AI hrozeb a ukázal, že útoky na strojové učení už nejsou jen teoretickým rizikem. Claudio Masolo, Elham Arshad, Sabri Allani, Vijay Dilwale a Igor Maljkovic popsali konkrétní incident response případy, kde útočníci zneužívají autonomní agenty, manipulují s tréninkovými daty a kombinují AI nástroje se sociálním inženýrstvím. Pro firmy, které integrují jazykové modely do produkčních workflow, panel přináší první strukturovanou mapu toho, co konkrétně musí security týmy dělat jinak než u klasických aplikací.

Data poisoning cílí na firemní fine-tuning, ne jen na veřejné datasety

Elham Arshad upozornila na posun v útocích na tréninkovou fázi modelů. Zatímco dřívější demonstrace data poisoningu se týkaly akademických datasetů, nově dokumentované případy ukazují cílené pokusy o kontaminaci firemních fine-tuningových sad. Útočník, který získá přístup k interním dokumentům používaným pro dotrénování modelu, může vložit škodlivé vzory, které model naučí generovat konkrétní výstupy na základě specifických vstupů.

Sabri Allani doplnil konkrétní scénář z finančního sektoru: útočník přidal do tréninkových dat desítky dokumentů s falešnými compliance pravidly, které model následně prezentoval jako platná interní směrnice. Detekce takového útoku je složitá, protože kontaminovaná data vypadají jako legitimní firemní obsah a chyba se projeví až v produkčním nasazení, kdy model začne doporučovat nesprávné postupy.

Autonomní agenti otevírají útočnou plochu mimo tradiční perimetr

Igor Maljkovic popsal kategorii útoků specifickou pro AI agenty, které mají oprávnění provádět akce v externích systémech. Klasická bezpečnostní opatření jako firewall nebo access control fungují na úrovni uživatelských účtů, ale agent jedná jménem systému s širšími privilegii. Útočník, který dokáže manipulovat s promptem nebo kontextem agenta, efektivně získává schopnost provádět akce, na které by sám neměl oprávnění.

Panel zdokumentoval incident, kde útočník zneužil customer service agenta připojeného k CRM systému. Agent měl oprávnění měnit zákaznická data za účelem řešení reklamací. Útočník poslal sérii dotazů napsaných tak, aby agent interpretoval požadavek jako legitimní servisní operaci a změnil fakturační údaje na účtu třetí strany. Tradiční audit log ukázal pouze legitimní API volání autorizované agentským účtem.

AI-powered social engineering kombinuje generativní modely s klasickými technikami

Vijay Dilwale představil analýzu phishingových kampaní, kde útočníci použili jazykové modely k personalizaci zpráv v dosud nedosažitelném měřítku. Místo hromadného rozesílání šablon útočník nasadil model, který pro každého cíle vygeneroval unikátní zprávu na základě veřejně dostupných informací z LinkedIn, firemních webů a konferenčních prezentací.

Claudio Masolo doplnil technické pozadí: útočník použil open-source model, který fine-tunoval na korpusu legitimních firemních e-mailů získaných z úniku dat. Výsledné zprávy měly přirozený tón, obsahovaly správnou terminologii a referovaly konkrétní projekty, které cíl skutečně řešil. Detekční systémy založené na rozpoznávání šablon nebo gramatických chyb tyto zprávy neodhalily.

Incident response musí zahrnovat inspekci trénovacích dat a prompt historie

Panel formuloval změny v incident response procesu specifické pro AI systémy. Standardní forensní analýza se soustředí na síťový provoz, logy autentizace a změny v souborových systémech. U AI incidentu je nutné přidat inspekci trénovacích dat, prompt historie, kontextových databází a výstupních logů modelu.

Sabri Allani popsal postup, kdy security tým musel rekonstruovat, které konkrétní dokumenty v RAG databázi vedly k problematickému výstupu modelu. Klasické nástroje pro log analýzu nejsou stavěné na parsování embeddings nebo vector search výsledků. Tým musel vyvinout vlastní skripty pro zpětné trasování od problematického outputu přes retrieved chunks zpět k původním dokumentům.

Security týmy potřebují nové role na rozhraní ML a klasické bezpečnosti

Elham Arshad uzavřela diskusi popisem organizačních změn. Firmy, které nasazují AI do produkce, potřebují lidi, kteří rozumí jak tradičním útokům, tak statistickým vlastnostem modelů. Klasický penetration tester neví, jak testovat robustnost modelu proti adversarial examples. ML inženýr zase nerozumí lateral movement nebo privilege escalation v síťovém prostředí.

Panel doporučil hybrid role, kde jeden člověk pokrývá security implikace celého AI pipeline od dat přes trénink až po deployment. Igor Maljkovic zmínil, že jejich firma vytvořila pozici AI Security Engineer, která kombinuje znalost OWASP Top 10 s porozuměním MITRE ATLAS framework pro AI-specific hrozby. Tento člověk koordinuje mezi data science týmem a klasickým SOC.

Tagy: AI AI automatizace AI governance AI implementace CXO Advisory umělá inteligence

Podnikáte a přemýšlíte nad nasazením AI? Nejdříve doporučuji udělat analýzu, tzv. Road Mapu nasazení AI, kde zjistíte, jak by Vám nejvíce AI AGENTI pomohli, aby to mělo okamžitý přínos.
Vypočítáme, kolik můžou vydělat, ušetřit, peněz i času. Cílem je, abyste si uvolnil ruce na strategicky důležité věci, pro rodinu a volný čas. Byznys poběží dále.

AI Agenti fungují jako reální zaměstnanci, ale nikdy nespí, nepotřebují odpočívat, nezapomenou nic z toho, co je naučíte. Zaškolíte je a pak už nemáte žádné starosti. A dokonce nechtějí ani výplatu, jen papají malé množství tokenů, což ale většinou spraví i paušál za 500,- Kč / měsíc za ChatGpt, nebo Claude. Orientačně vyjdou na cca 6.000,- Kč/ měsíc, ale práce většinou udělají i za desítky tisíc a nepotřebují kancelář, ani služební auto. Telefonní číslo ale potřebují, aby mohli reagovat na zprávy a komunikovat ven.

Ilustrační obrázek k článku: Co znamená novinka v AI pro malé a střední firmy: OpenAI to acquire Ona

Chci Road Mapu nasazení AI agentů pro své podnikání.

Analýza stojí 4.900,- Kč, ale pro prvních 50 klientů je to nyní na naše náklady.

Podobné články

Anthropic spustil Cowork: agent Claude, který pracuje s vašimi soubory bez řádku kódu

V pondělí Anthropic vydal Cowork, novou funkci pro Claude Desktop, která rozšiřuje…

CVE-2026-LGTM: Když se dva AI agenti pohádají o bezpečnost balíčku a spálí 41 tisíc dolarů

Andrew Nesbitt publikoval hypotetický incident report popisující situaci, kdy dva AI bezpečnostní…

Amazon a Snowflake spojily sémantický model s přirozeným dotazováním — končí éra manuálních SQL filtrů v BI

Amazon Web Services právě zveřejnil technickou návod, jak propojit Snowflake sémantické pohledy…

Tato stránka používá cookies

Na stránkách používáme soubory cookies. Některé jsou nezbytné pro fungování stránek, jiné nám umožňují poskytnout vám lepší zkušenost při návštěvě našich stránek nebo zobrazování reklamy, pomáhají nám analyzovat návštěvnost a stránky zlepšovat.

Nastavení cookies Odmítnout vše Přijmout vše

Souhlas s používáním cookies

Cookies jsou malé soubory, které se dočasně ukládají ve vašem počítači a pomáhají nám k lepší uživatelské zkušenosti na našich stránkách. Cookies používáme k personalizaci obsahu stránek a reklam, poskytování funkcí sociálních sítí a k analýze návštěvnosti. Informace o vašem používání našich stránek také sdílíme s našimi partnery v oblasti sociálních sítí, reklamy a analýzy, kteří je mohou kombinovat s dalšími informacemi, které jste jim poskytli nebo které shromáždili při vašem používání jejich služeb.

Ze zákona můžeme na vašem zařízení ukládat pouze soubory cookie, které jsou nezbytně nutné pro provoz těchto stránek. Pro všechny ostatní typy souborů cookie potřebujeme vaše svolení. Budeme vděční, když nám ho poskytnete a pomůžete nám tak, naše stránky a služby zlepšovat. Svůj souhlas s používáním cookies na našem webu můžete samozřejmě kdykoliv změnit nebo odvolat.

Jednotlivé souhlasy

Nezbytné - aby stránky fungovaly, jak mají.

Nezbytné soubory cookie pomáhají učinit webové stránky použitelnými tím, že umožňují základní funkce, jako je navigace na stránce a přístup k zabezpečeným oblastem webové stránky. Bez těchto souborů cookie nemůže web správně fungovat.

Preferenční - abychom si pamatovali vaše preference.

Preferenční cookies umožňují, aby si stránka pamatovala informace, které upravují, jak se stránka chová nebo vypadá. Např. vaše přihlášení, obsah košíku, zemi, ze které stránku navštěvujete.

Statistické - abychom věděli, co na webu děláte a co zlepšit.

Statistické cookies pomáhají provozovateli stránek pochopit, jak návštěvníci stránek stránku používají, aby mohl stránky optimalizovat a nabídnout jim lepší zkušenost. Veškerá data se sbírají anonymně a není možné je spojit s konkrétní osobou.

Marketingové - abychom vám ukazovali pouze relevantní reklamu.

Marketingové cookies se používají ke sledování pohybu návštěvníků napříč webovými stránkami s cílem zobrazovat jim pouze takovou reklamu, která je pro daného člověka relevantní a užitečná. Veškerá data se sbírají a používají anonymně a není možné je spojit s konkrétní osobou.

Uložit nastavení

Odmítnout vše Přijmout vše