Odstrániť HTML značky
Zlozvyk niektorých e‑shopov je, že do XML pre Heuréku, Zboží.cz či iné vyhľadávače tovaru vkladajú HTML značky. Spoznáte ich podľa toho, že sú uzavreté do špicatých zátvoriek, napríklad
a pod. Tieto značky niektorým vyhľadávačom tovaru prekážajú, a tak som pripravil pravidlo, ktoré ich automaticky odstráni.
Ilustrácia fungovania Mergadovho pravidla Odstrániť HTML značky.
Vybrať kategóriu
Niektoré e‑shopy umožňujú zaradiť jednu položku tovaru do viacerých kategórií. A následne generujú do XML pre Heureku viackrát značku CATEGORYTEXT. Tento element je pre Heureku veľmi dôležitý. Heureka však vie spracovať iba prvý výskyt elementu CATEGORYTEXT a ostatné ignoruje. Ak má e‑shop v XML najprv CATEGORYTEXT “Výpredaj” a až následne “Rybárske potreby | Stany a prístrešky | Rybárske prístrešky”, spracuje Heureka len “Výpredaj”. Táto kategória nie je kvalitná a produkt nebude spárovaný. Mergadove nové pravidlo toto rieši tak, že ak sa vyskytne element CATEGORYTEXT viackrát, ponechá iba ten najlepší a ostatné skryje.
Ilustrácia fungovania Mergadovho pravidla Výber kategórií.
Ako zapnúť tieto nové pravidlá
Jednoducho v exporte na stránke “Pravidlá” kliknite na odkaz “Vytvoriť pravidlo” a ako “Typ pravidla” vyberte “Odstrániť HTML značky” alebo “Vybrať kategóriu”. Uložte stlačením tlačidla naspodku stránky. Zmena sa prejaví po pravidelnom pregenerovaní dát Mergadom.
Vyskúšajte si nové pravidla priamo v Mergade!