Quando si crea un file che verrà richiamato tramite URL, è importante evitare l’uso di determinati caratteri che possono causare problemi o essere interpretati in modo errato dai browser o dai server.
Ecco una lista di caratteri da evitare:
- Spazi: Anche se i browser li codificano come
%20
, è meglio evitare spazi nei nomi dei file. - Caratteri speciali riservati:
#
(cancelletto): Indica l’inizio di un’ancora in un URL.?
(punto interrogativo): Segna l’inizio di una query string.&
(e commerciale): Usato per separare i parametri nelle query string.%
(percento): Indica l’inizio di un carattere codificato.+
(più): Spesso usato come sostituto dello spazio nelle query string./
(barra): Usata per separare i percorsi nelle URL.\\
(backslash): Potrebbe causare problemi in alcuni sistemi operativi o browser.:
(due punti): Separatore di protocollo e porta, può causare confusione.;
(punto e virgola): Usato per separare i parametri all’interno di una query string.=
(uguale): Usato per assegnare valori ai parametri nelle query string.@
(chiocciola): Usato per specificare le credenziali di accesso.[
e]
(parentesi quadre): Usate per gli indirizzi IPv6.<
,>
(minore e maggiore): Non sono validi negli URL."
(virgolette): Non sono validi negli URL.
- Caratteri non ASCII: È consigliabile evitare caratteri che non appartengono all’insieme ASCII (es. caratteri accentati o simboli non standard) perché possono non essere gestiti correttamente su tutti i sistemi.
- Caratteri di controllo: Evitare l’uso di caratteri di controllo non stampabili, come i caratteri di ritorno a capo, tabulazioni, ecc.
Consigli su come nominare i file per il Web
- Utilizza solo lettere minuscole, numeri e simboli sicuri come trattini (
-
) o underscore (_
). - Se necessario, usa la codifica URL per rappresentare caratteri speciali (es.
%20
per lo spazio). - Mantieni i nomi dei file semplici e descrittivi per evitare problemi di compatibilità.
Seguendo queste linee guida, ridurrai al minimo i problemi quando richiamerai i file tramite URL.
Utility e Software per rinominare i file
Diversi programmi hanno una funzione che permette di salvare i file con nomi ottimizzati per il web, per esempio: Adobe Creative Cloud, GitHub, Google Drive. Purtroppo non Microsoft Office.
La norma è comunque sempre ottimizzare i file e controllarne il nome, prima dell’upload.
Per operare su un gran numero di file esistono molte utility che permettono di rinominare in massa i file, come Bulk Rename Utility e Advanced Renamer, che possono essere configurati per rinominare i file secondo regole specifiche.
Content Management Systems (CMS)
I moderni CMS come PrestaShop, WordPress e Dupal, hanno funzioni che rimuovono i caratteri speciali e sostituiscono gli spazi, normalizzando i file per l’uso sul web quando li carichiamo attraverso i relativi file manager. Però va sempre posta attenzione soprattutto se l’upload del file avviene tramite moduli e plugin o via FTP.
La norma è prevenire e prendere l’abitudine di salvare i nostri file già nel formato corretto.
Perché queste regole sono importanti in HTTP
Le regole su come nominare un file, riguardano principalmente il protocollo HTTP (Hypertext Transfer Protocol), che è il protocollo utilizzato per la comunicazione web su Internet. In particolare, queste regole si applicano agli URL (Uniform Resource Locator), che specificano l’indirizzo di una risorsa web e vengono utilizzati dai browser per recuperare i contenuti dal server. Perché sono importanti:
- Interpretazione corretta dell’URL: Il protocollo HTTP utilizza l’URL per localizzare risorse sul web. Se un URL contiene caratteri che hanno significati specifici (come
?
,&
,#
), il server o il browser può interpretare l’URL in modo diverso da quanto previsto. Questo può portare a errori di caricamento della pagina o al recupero di informazioni sbagliate. - Compatibilità tra browser e server: Non tutti i browser o server gestiscono allo stesso modo i caratteri non standard o non ASCII. L’uso di caratteri non sicuri può causare problemi di compatibilità, portando a risultati imprevedibili.
- Sicurezza: Alcuni caratteri potrebbero essere utilizzati in attacchi di iniezione (ad esempio, SQL injection o Cross-Site Scripting – XSS). Evitare caratteri problematici negli URL riduce il rischio di queste vulnerabilità.
- Codifica URL: Anche se il protocollo HTTP permette la codifica di caratteri speciali usando il formato
%XX
(doveXX
è il valore esadecimale del carattere), è buona norma limitare l’uso di caratteri non sicuri e utilizzare solo quelli che sono generalmente riconosciuti come sicuri per evitare errori di codifica.
In sintesi, le regole sono strettamente correlate al protocollo HTTP e agli URL, seguire queste linee guida garantisce che le risorse web siano accessibili in modo sicuro e affidabile su Internet.