ArchivQA
Zum Trainings-Check

Auflösung & Aspect-Ratio-Buckets fürs KI-Training

Wie viel Auflösung Trainingsbilder wirklich brauchen, was Aspect-Ratio-Bucketing bedeutet und warum hochskalierte Bilder dem Modell schaden.

Auflösung ist beim KI-Training keine „je mehr, desto besser"-Größe. Entscheidend ist, ob ein Bild die Zielauflösung des Modells übersteht — und ob seine Detailschärfe echt ist oder nur hochgerechnet.

Aspect-Ratio-Bucketing kurz erklärt

Moderne Bildgeneratoren trainieren nicht auf einer einzigen quadratischen Größe, sondern in Auflösungs-Buckets: Bilder werden nach Seitenverhältnis gruppiert und je Bucket auf eine Zielkantenlänge skaliert — typisch 512, 768 oder 1024 px. So bleibt das Seitenverhältnis erhalten, ohne dass quadratisch zugeschnitten werden muss.

Faustregel

Es zählt die kurze Kante. Ein 4000×800-Panorama hat viele Pixel, fällt aber durch — 800 px kurze Kante und ein extremes Seitenverhältnis, das sich kaum in einen Bucket einsortieren lässt, ohne den halben Bildinhalt wegzucroppen.

Seitenverhältnis: extrem ist problematisch

Sehr längliche Bilder (Panoramen, dünne Streifen) passen schlecht ins Bucketing. Beim Zuschnitt auf trainierbare Proportionen geht entweder viel Bildinhalt verloren, oder das Bild landet in einem Rand-Bucket mit wenigen Beispielen. Verhältnisse jenseits von etwa 3:1 sind kritisch.

Die Upscale-Falle

Ein häufiger Müll-Typ in gescrapten Datensätzen: Bilder, die auf eine hohe Pixelzahl hochskaliert wurden, ohne echtes Detail zu gewinnen. Sie sehen „groß" aus, sind aber weich — das Modell lernt aus ihnen Unschärfe statt Struktur. Unser Check misst die native Detailschärfe relativ zur Auflösung und warnt bei Verdacht. Mehr zur Schärfemessung steht bei den Qualitätsstufen.

Welches Format dabei sinnvoll ist (verlustfrei vs. komprimiert), behandelt unser allgemeiner Formatvergleich.

Dein Bild auf Trainings-Tauglichkeit prüfen?
Kostenlos · 3 Checks pro Tag · ohne Anmeldung.
Zum Check