Auflösung ist beim KI-Training keine „je mehr, desto besser"-Größe. Entscheidend ist, ob ein Bild die Zielauflösung des Modells übersteht — und ob seine Detailschärfe echt ist oder nur hochgerechnet.
Aspect-Ratio-Bucketing kurz erklärt
Moderne Bildgeneratoren trainieren nicht auf einer einzigen quadratischen Größe, sondern in Auflösungs-Buckets: Bilder werden nach Seitenverhältnis gruppiert und je Bucket auf eine Zielkantenlänge skaliert — typisch 512, 768 oder 1024 px. So bleibt das Seitenverhältnis erhalten, ohne dass quadratisch zugeschnitten werden muss.
- ≥ 1024 px kurze Kante: tauglich für die 1024er-Buckets aktueller Modelle.
- ≥ 768 px: solide Mittelklasse.
- ≥ 512 px: Minimum — für moderne Modelle bereits knapp.
- < 512 px: nach dem Downscale bleibt zu wenig übrig.
Faustregel
Es zählt die kurze Kante. Ein 4000×800-Panorama hat viele Pixel, fällt aber durch — 800 px kurze Kante und ein extremes Seitenverhältnis, das sich kaum in einen Bucket einsortieren lässt, ohne den halben Bildinhalt wegzucroppen.
Seitenverhältnis: extrem ist problematisch
Sehr längliche Bilder (Panoramen, dünne Streifen) passen schlecht ins Bucketing. Beim Zuschnitt auf trainierbare Proportionen geht entweder viel Bildinhalt verloren, oder das Bild landet in einem Rand-Bucket mit wenigen Beispielen. Verhältnisse jenseits von etwa 3:1 sind kritisch.
Die Upscale-Falle
Ein häufiger Müll-Typ in gescrapten Datensätzen: Bilder, die auf eine hohe Pixelzahl hochskaliert wurden, ohne echtes Detail zu gewinnen. Sie sehen „groß" aus, sind aber weich — das Modell lernt aus ihnen Unschärfe statt Struktur. Unser Check misst die native Detailschärfe relativ zur Auflösung und warnt bei Verdacht. Mehr zur Schärfemessung steht bei den Qualitätsstufen.
Welches Format dabei sinnvoll ist (verlustfrei vs. komprimiert), behandelt unser allgemeiner Formatvergleich.