Dlouhé konverzace

Dlouhý chat je pohodlný, ale není ideální jako výchozí způsob práce. Jazykový model má omezené kontextové okno, tedy omezenou pracovní paměť, do které se počítá vaše zadání, předchozí zprávy i část právě generované odpovědi. Konkrétní velikost závisí na modelu a obvykle se udává v tokenech, ne ve slovech.

Proto v praxi platí jednoduché pravidlo: držte konverzace krátké a tematicky čisté. Když se věc začne větvit, založte nový chat.

Praktické doporučení

jeden chat používejte pro jedno téma nebo jednu pracovní větev,
při změně tématu začněte novou konverzaci,
pokud chcete porovnat dvě varianty, otevřete dvě oddělené konverzace,
starou konverzaci držte jen tehdy, když na její historii skutečně záleží.

Proč dlouhé chaty zhoršují výsledek

Každá další výměna postupně zaplňuje kontextové okno. S rostoucím množstvím textu roste i riziko, že model přehlédne detail, pomíchá starší a novější instrukce nebo začne odpovídat méně přesně. Větší kontext proto není automaticky lepší. Důležité je, aby byl relevantní a přehledný.

Dlouhá konverzace navíc často obsahuje staré odbočky, slepé pokusy a mezikroky, které už nejsou pro aktuální dotaz důležité. Model je ale stále vidí jako součást pracovního prostoru, a tím se zvyšuje šum.

Co se stane při naplnění kontextu

Jakmile se konverzace přiblíží limitu, aplikace nad modelem musí se starší historií nějak naložit. Samotné "překročení" limitu totiž neznamená, že by model najednou udržel více textu. V praxi se proto používá zejména zkrácení historie, shrnutí nebo kompaktace do hustší podoby. Tím se zachová hlavní směr konverzace, ale ne nutně všechny formulace, drobné detaily nebo mezikroky.

Jinými slovy: dlouhý chat není archiv s dokonalou pamětí. Je to pracovní prostor s omezenou kapacitou.

Kdy založit nový chat

Novou konverzaci je vhodné začít zejména tehdy, když:

měníte téma,
odbočujete do jiné právní nebo obchodní otázky,
potřebujete rozpracovat alternativní variantu,
chcete mít kratší a lépe řiditelný kontext bez starého balastu.

Stručné technické vysvětlení

Kontextové okno je maximální objem textu, který má model v dané chvíli k dispozici. Patří sem prompt, předchozí zprávy i text, který model právě vytváří.

Primární zdroje:

Dlouhý kontext není automaticky lepší. Když v něm zůstává příliš mnoho starších nebo už nerelevantních informací, model se v nich může hůře orientovat.

Technické pozadí:

OpenAI uvádí, že každý model má maximální kombinovaný limit tokenů pro vstup a výstup.
Pokud se blížíte limitu, doporučený postup je prompt zkrátit, rozdělit větší text na menší části nebo vstupy předem shrnout.

Primární zdroje:

Když se session blíží limitu, některé systémy použijí kompaktaci: starší historii zkrátí, shrnou nebo z ní ponechají jen nejdůležitější část.

Technické pozadí:

Toto je obecné technické vysvětlení toho, jak některé AI systémy řeší dlouhé session.
Pro běžnou práci v CODEXIS AI z toho plyne jednoduché pravidlo: držte konverzace krátké a při větvení tématu zakládejte nový chat.

Velikost kontextového okna se obvykle uvádí v tokenech, ne ve slovech. Token může odpovídat slovu, části slova, znaku nebo bajtu.

Primární zdroj:

OpenAI Help - What are tokens and how to count them?

Doplňkové technické zdroje pro úplnost

Následující odkazy jsou doplňkové. Nepopisují přímo produktové nastavení CODEXIS AI na GPT-5.4, ale jsou užitečné pro hlubší technické pozadí k práci s dlouhým kontextem a ke kompaktaci historie.