UTF-8 is een standaard tekencoderingsmethode voor het opslaan van Unicode die is ontwikkeld om verschillende talen weer te geven.
Omdat Unicode en UTF-8 pas na de jaren '90 werden ontwikkeld, ondersteunde een eerste versie van het ZIP-formaat (gemaakt in de jaren '80) UTF-8 niet. Toen het ZIP-formaat het standaard archiefformaat werd en het Unicode moest ondersteunen, zijn er echter verschillende manieren geïntroduceerd om UTF-8 strings in ZIP-bestanden te verwerken.
Bandizip ondersteunt er twee; de ene manier is om de bestandsnamen te converteren naar UTF-8, en de andere manier is om extra UTF-8 bestandsnamen op te slaan in een extra kopveld terwijl de originele worden opgeslagen in MBCS.
Bandizip slaat bestandsnamen op in ZIP-bestanden door ze te converteren naar UTF-8. Het is een standaard opslagmethode voor bestandsnamen gedefinieerd door APPNOTE, maar sommige archiveringsprogramma's herkennen de ZIP-bestanden soms niet of gaan er verkeerd mee om, waardoor de bestandsnamen kapot gaan. APPNOTE
Bandizip slaat extra UTF-8 bestandsnamen op in een extra kopveld van het ZIP formaat, terwijl de originele namen worden opgeslagen in MBCS. Deze methode wordt door APPNOTE ook gedefinieerd als "Info-ZIP Unicode Path Extra Field". Omdat het een extra veld gebruikt om de UTF-8 bestandsnamen op te slaan, zijn de bestandsgroottes tientallen bytes groter dan de vorige. De originele bestandsnamen worden echter opgeslagen in MBCS en daarom zijn de bestanden veiliger en meer compatibel.
Aangezien de meeste archiveringsprogramma's (zoals 7zip, Winrar en Winzip) deze functie ondersteunen, wordt voorkomen dat je bestandsnamen kapot gaan in besturingssystemen met een andere systeemtaal.
De afbeelding hieronder laat het verschil zien tussen het wel en niet gebruiken van de functie bij het verzenden van een ZIP-bestand dat is gecomprimeerd op een Koreaans besturingssysteem naar een Japans besturingssysteem.
TAR en TGZ formaten zijn archiefformaten die voornamelijk gebruikt worden op Unix (dat UTF-8 bestandsnamen gebruikt). Met deze functie kan je TAR/TGZ-bestanden op Unix uitpakken zonder problemen met bestandsnamen.
OPMERKING: Sommige Windows-toepassingen herkennen de UTF-8-codepagina van TAR/TGZ-indelingen mogelijk niet goed.