Quali caratteri sono proibiti per il nome di immagini e file da richiamare via URL

Tabella dei Contenuti

Quando si crea un file che verrà richiamato tramite URL, è importante evitare l’uso di determinati caratteri che possono causare problemi o essere interpretati in modo errato dai browser o dai server.

Ecco una lista di caratteri da evitare:

  • Spazi: Anche se i browser li codificano come %20, è meglio evitare spazi nei nomi dei file.
  • Caratteri speciali riservati:
    • # (cancelletto): Indica l’inizio di un’ancora in un URL.
    • ? (punto interrogativo): Segna l’inizio di una query string.
    • & (e commerciale): Usato per separare i parametri nelle query string.
    • % (percento): Indica l’inizio di un carattere codificato.
    • + (più): Spesso usato come sostituto dello spazio nelle query string.
    • / (barra): Usata per separare i percorsi nelle URL.
    • \\ (backslash): Potrebbe causare problemi in alcuni sistemi operativi o browser.
    • : (due punti): Separatore di protocollo e porta, può causare confusione.
    • ; (punto e virgola): Usato per separare i parametri all’interno di una query string.
    • = (uguale): Usato per assegnare valori ai parametri nelle query string.
    • @ (chiocciola): Usato per specificare le credenziali di accesso.
    • [ e ] (parentesi quadre): Usate per gli indirizzi IPv6.
    • <, > (minore e maggiore): Non sono validi negli URL.
    • " (virgolette): Non sono validi negli URL.
  • Caratteri non ASCII: È consigliabile evitare caratteri che non appartengono all’insieme ASCII (es. caratteri accentati o simboli non standard) perché possono non essere gestiti correttamente su tutti i sistemi.
  • Caratteri di controllo: Evitare l’uso di caratteri di controllo non stampabili, come i caratteri di ritorno a capo, tabulazioni, ecc.

Consigli su come nominare i file per il Web

  • Utilizza solo lettere minuscole, numeri e simboli sicuri come trattini (-) o underscore (_).
  • Se necessario, usa la codifica URL per rappresentare caratteri speciali (es. %20 per lo spazio).
  • Mantieni i nomi dei file semplici e descrittivi per evitare problemi di compatibilità.

Seguendo queste linee guida, ridurrai al minimo i problemi quando richiamerai i file tramite URL.

Utility e Software per rinominare i file

Diversi programmi hanno una funzione che permette di salvare i file con nomi ottimizzati per il web, per esempio: Adobe Creative Cloud, GitHub, Google Drive. Purtroppo non Microsoft Office.

La norma è comunque sempre ottimizzare i file e controllarne il nome, prima dell’upload.
Per operare su un gran numero di file esistono molte utility che permettono di rinominare in massa i file, come Bulk Rename Utility e Advanced Renamer, che possono essere configurati per rinominare i file secondo regole specifiche.

Content Management Systems (CMS)

I moderni CMS come PrestaShop, WordPress e Dupal, hanno funzioni che rimuovono i caratteri speciali e sostituiscono gli spazi, normalizzando i file per l’uso sul web quando li carichiamo attraverso i relativi file manager. Però va sempre posta attenzione soprattutto se l’upload del file avviene tramite moduli e plugin o via FTP.

La norma è prevenire e prendere l’abitudine di salvare i nostri file già nel formato corretto.

Perché queste regole sono importanti in HTTP

Le regole su come nominare un file, riguardano principalmente il protocollo HTTP (Hypertext Transfer Protocol), che è il protocollo utilizzato per la comunicazione web su Internet. In particolare, queste regole si applicano agli URL (Uniform Resource Locator), che specificano l’indirizzo di una risorsa web e vengono utilizzati dai browser per recuperare i contenuti dal server. Perché sono importanti:

  • Interpretazione corretta dell’URL: Il protocollo HTTP utilizza l’URL per localizzare risorse sul web. Se un URL contiene caratteri che hanno significati specifici (come ?, &, #), il server o il browser può interpretare l’URL in modo diverso da quanto previsto. Questo può portare a errori di caricamento della pagina o al recupero di informazioni sbagliate.
  • Compatibilità tra browser e server: Non tutti i browser o server gestiscono allo stesso modo i caratteri non standard o non ASCII. L’uso di caratteri non sicuri può causare problemi di compatibilità, portando a risultati imprevedibili.
  • Sicurezza: Alcuni caratteri potrebbero essere utilizzati in attacchi di iniezione (ad esempio, SQL injection o Cross-Site Scripting – XSS). Evitare caratteri problematici negli URL riduce il rischio di queste vulnerabilità.
  • Codifica URL: Anche se il protocollo HTTP permette la codifica di caratteri speciali usando il formato %XX (dove XX è il valore esadecimale del carattere), è buona norma limitare l’uso di caratteri non sicuri e utilizzare solo quelli che sono generalmente riconosciuti come sicuri per evitare errori di codifica.

In sintesi, le regole sono strettamente correlate al protocollo HTTP e agli URL, seguire queste linee guida garantisce che le risorse web siano accessibili in modo sicuro e affidabile su Internet.