- [Case Studies](https://www.mergado.cz/kategorie/case-studies)
- [E‑commerce tipy](https://www.mergado.cz/kategorie/e-commerce-tipy)
- [E‑shopová řešení a platformy](https://www.mergado.cz/kategorie/e-shopova-reseni-a-platformy)
- [Mergado Pack](https://www.mergado.cz/kategorie/mergado-pack)
- [Mergado tipy](https://www.mergado.cz/kategorie/mergado-tipy)
- [Novinky v Mergadu](https://www.mergado.cz/kategorie/novinky-v-mergadu)
- [Novinky ze srovnávačů](https://www.mergado.cz/kategorie/novinky-ze-srovnavacu)
- [Pracujeme s Mergadem](https://www.mergado.cz/kategorie/pracujeme-s-mergadem)
- [Rozhovory](https://www.mergado.cz/kategorie/rozhovory)
- [Rozšíření](https://www.mergado.cz/kategorie/aplikace)
- [S Mergadem do zahraničí](https://www.mergado.cz/kategorie/s-mergadem-do-zahranici)
- [Ze života Mergada](https://www.mergado.cz/kategorie/ze-zivota-mergada)
 



 

 1. [  Úvod  ](https://www.mergado.cz/)
2. [     Blog  ](https://www.mergado.cz/blog)
3. [     Rozšíření  ](https://www.mergado.cz/kategorie/aplikace)
4. <a class="flex items-center gap-2 hover:underline" href="" itemid="" itemprop="item" itemscope="" itemtype="https://schema.org/Thing">    **Stáhněte si celý web do jednoho CSV se Scraping Camel** </a>
 
  

 

#  **Stáhněte si celý web do jednoho CSV se Scraping Camel** 

 

 

 [    ![](https://www.mergado.cz/sites/default/files/perm/image/profil-foto.jpg)   Petra Marková  ](https://www.mergado.cz/blog/petra-markova) [Rozšíření](https://www.mergado.cz/kategorie/aplikace) 

25. 3. 2021

4 minuty čtení

 

 

 

 

 

  ![](https://www.mergado.cz/sites/default/files/perm/image/cely-web-do-csv-scraping-camel.png)  

Chcete ze stránek či e‑shopů **získávat data**, která nejsou obsažena v XML feedu? K cenným informacím se dostanete jednoduše pomocí nové aplikace [Scraping Camel](https://store.mergado.com/detail/scrapingcamel/#about). Využijte její funkce pro **efektivnější tvorbu PPC reklam či SEO**. Ukážeme vám, jak na to.



 

 

 
                function tableOfContents() {
                  return {
                    headings_menu: [],
                    heading_active: '', // Added to track the active section
                    shouldBeSticky: false,

                    generateToC() {
                      const headings = document.querySelectorAll('.js-article-full-headings h2, .js-article-full-headings h3');
                      let headingMap = {};

                      headings.forEach((heading) => { // Use an arrow function to maintain `this` context
                        // Normalize heading text to remove diacritics, then replace non-alphanumeric characters with dashes
                        var normalizedText = heading.textContent.normalize("NFD").replace(/[\u0300-\u036f]/g, ""); // Remove diacritics
                        var id = heading.id ? heading.id : normalizedText.trim().toLowerCase()
                          .split(' ').join('-').replace(/[^a-z0-9\-]/ig, ''); // Updated regex to replace non-alphanumeric characters
                        headingMap[id] = headingMap[id] !== undefined ? ++headingMap[id] : 0;

                        // Use the updated `id` with diacritics removed for the heading id and the TOC
                        const finalId = headingMap[id] ? `${id}-${headingMap[id]}` : id;
                        this.headings_menu.push({
                          id: finalId,
                          title: heading.textContent,
                          level: heading.tagName.toLowerCase(), // Track heading level
                          active: false, // Initially set active to false
                        });
                        heading.id = finalId;
                      });
                    },

                    checkStickyNeeded() {
                      const ul = this.$el.querySelector('ul');
                      if (ul) {
                        this.shouldBeSticky = ul.scrollHeight < window.innerHeight;
                      }
                    },

                    setActiveHeading() {
                      // disabled not working with active state on click
                      // add @scroll.window="setActiveHeading()" to the parent div

                      // const headings = document.querySelectorAll('.js-article-full-headings h2');
                      // let activeHeading = '';
                      // let closestHeadingDistance = Infinity;

                      // headings.forEach((heading) => {
                      //   const rect = heading.getBoundingClientRect();
                      //   const offset = rect.top - window.innerHeight / 2; // Consider heading in the middle of the screen as active

                      //   if (offset < 0 && Math.abs(offset) < closestHeadingDistance) {
                      //     activeHeading = heading.id;
                      //     closestHeadingDistance = Math.abs(offset);
                      //   }
                      // });

                      // // Update the active state in headings_menu
                      // if (activeHeading !== this.heading_active) {
                      //   this.headings_menu = this.headings_menu.map(item => ({
                      //     ...item,
                      //     active: item.id === activeHeading,
                      //   }));
                      //   this.heading_active = activeHeading;

                      // }
                    },

                    setActiveItem(clickedId) {
                      this.headings_menu.forEach(item => {
                        item.active = (item.id === clickedId);
                      });
                      this.heading_active = clickedId; // Optionally update the heading_active property if used
                    },
                  };
                }
               1. <a :class="{ 'border-r-[3px] border-secondary': item.active, 'text-sm': item.level === 'h3' }" :href="'#' + item.id" class="inline-block text-balance hover:underline p-0.5 pr-3">  — </a>
  



 

## Mějte všechny potřebné informace v jednom souboru

[Scraping Camel](https://store.mergado.com/detail/scrapingcamel/#about) je vyvinutý firmou Shopitak, která se zaměřuje na vývoj aplikací pro ekosystém Mergada. Appka prochází HTML stránky webu a získává z nich libovolné informace, které uloží a **vygeneruje jeden výstupní CSV soubor**. Díky tomu je appka vhodná pro kvalitní datové analýzy produktů i kategorií.

[![](https://lh4.googleusercontent.com/vGUePmwgWA3fZMtIzVR-SCdK_pUWWsbWrCZgLI7B_iZ5iKGHnwCTH7_1br_EhqlnGzVB_yTJXqmIkzjfZNdY9IG8afe1n_GehsnRKms-ZNpnDTUgoSE33c_ubjAHiT6oSahHI5QR)](https://store.mergado.com/detail/scrapingcamel/#about)

Jaká data můžete ze stránek získat? Pomocí aplikace **dostanete z webu jakékoliv informace**, například Title, Meta Description, nadpisy H1 a H2, ID značky Google Analytics či Google Tag Manager.

Aplikace dokáže **zpracovávat i weby, které nejsou e‑shopy**. Jedná se například o různé katalogy (móda, cestovky apod.) či webové prezentace. Jejich data umí v Mergadu upravit pro PPC reklamu na Google Ads a obvyklé postupy pro e‑shopy zvládne dál zpracovat. V případě, že shopsystém uživatele negeneruje XML (či jiné) feedy, dokáže získat potřebné informace a dále s nimi pracovat v [Mergadu](https://www.mergado.cz/zaciname-s-mergadem).

Se [Scraping Camelem](https://forum.mergado.cz/t/scraping-camel-news/1473) aplikujete pracovní postupy feed marketingu z e‑shopů s XML feedem i na weby bez košíku. Data jsou průběžně automatizovaná a výstupy **dostupné online** pro další aplikace či datová napojení.



 

  ![](https://www.mergado.cz/themes/custom/mergado/static/images/banner/mergado-store.svg) Stáhněte si celý web do jednoho CSV

Scraping Camel vám projde HTML stránky webu, získá z nich informace, tyto informace uloží a vygeneruje z nich jeden výstupní CSV soubor.

 

 [VYZKOUŠET ZDARMA](https://store.mergado.com/detail/scrapingcamel/#about) 

  ![](https://www.mergado.cz/themes/custom/mergado/static/images/banner/mergado-store.svg)  

 

 [  ![](https://www.mergado.cz/sites/default/files/perm/image/scraping-camel-schema.png)  ](https://www.mergado.cz/sites/default/files/perm/image/scraping-camel-schema.png) 

### Jak funguje aplikace Scraping Camel

1. Definujte si **doménu**, kterou má aplikace procházet.
2. Proveďte její **ověření**, které je podobné jako u Google. Na výběr máte z vložení souboru na web, META značky do stránek či DNS záznamu. Cílem je dokázat, že nejde o cizí web.
3. Vložte **sitemap.xml**, které je podmínkou pro fungování aplikace. Scraping Camel odsud bere [URL](https://www.mergado.cz/tema/url-v-xml-feedu) stránky webu.
4. Následně nastavte **frekvenci** procházení webu — příliš mnoho dotazů může web přetížit a málo naopak zpomalit zpracování celého webu.
5. Dále zvolte, jaké **elementy** chcete získávat z cílových HTML stránek. Výchozí jsou title, meta description nebo si nadefinujte vlastní elementy (prostřednictvím [regulárního výrazu](https://www.mergado.cz/workshop-regularni-vyrazy-v-mergadu) nebo uvedením textu před a za hledanými informacemi).
6. Nastavte si, jak se ve výstupním CSV mají **jmenovat** elementy se získanými informacemi.
7. V závěru začne aplikace **procházet** cílový web. Až ho celý zpracuje, vygeneruje výstupní [CSV](https://www.mergado.cz/tema/csv) a v administraci uvede jeho adresu.



 

Jak si **nastavit** Scraping Camel krok za krokem? **Detailní postup** najdete v této [dokumentaci](https://info.scraping-camel.cz/).

 

 

 

 

 

### Jak použít aplikaci Scraping Camel?

Na testovacím e‑shopu vám ukážeme, jak jednoduše **získáte SEO data a popis produktu**.



 

- ### 1. Klikněte na záložku “Upravit elementy”
    
      
    
     
    
     ![](/sites/default/files/users/screenshot-app.mergado.com-2021.03.16-15_51_45.png)
- ### 2. Klikněte na “Přidejte vlastní element” a elementy si pojmenujte podle vašich preferencí
    
      
    
     
    
     ![](/sites/default/files/users/screenshot-app.mergado.com-2021.03.16-15_56_22.png)
- ### 3. Přejděte na web, ze kterého chcete získat data a stiskněte klávesu CTRL+U
    
      
    
     
    
     
    - Táto klávesová zkratka vám umožní vidět zdrojový kód webu, který potřebujete k nadefinování elementů. Anebo můžete kliknout na pravé tlačítko myši a takto zobrazit zdrojový kód stránky.
    - Pomocí klávesové zkratky CTRL+F (slouží na vyhledávání obsahu na dané stránce) zadejte požadovaný element, který chcete získat. V tomto případě chceme najít popis produktu, tedy: &lt;h3&gt;Detailní popis produktu&lt;/h3&gt;
    
    ![](/sites/default/files/users/screenshot_from_2021-03-16_16-02-32.png)
- ### 4. Přejděte zpět do aplikace Scraping Camel
    
      
    
     
    
     Do “Hodnoty před” zadejte: &lt;h3&gt;Detailní popis produktu&lt;/h3&gt; a do “Hodnoty pod” zadáte &lt;/​div&gt;. Vypadat to bude následovně:
    
    ![](/sites/default/files/users/screenshot-app.mergado.com-2021.03.17-08_25_59.png)
- ### 5. Výsledek
    
      
    
     
    
     Aplikace **primárně neslouží na prohlížení dat**, myslete na to. Doporučujeme, abyste data prohlíželi v jiném programu, například v *Mergadu* nebo *Google Sheets*. Stejný postup aplikujte i na ostatní prvky, které chcete z webu získat.
    
    ![](/sites/default/files/users/screenshot-app.mergado.com-2021.03.17-08_53_26.png)
 
 

 

[Scraping Camel](https://info.scraping-camel.cz/) **pravidelně a automaticky kontroluje cílový web**. Pokud najde novou stránku, ihned ji zpracuje a případné změny promítne ve výstupním CSV souboru.

Aplikaci využijí **nejen e‑shopaři**. Do CSV souboru dokáží načíst údaje o zboží či službě ze stránky bez feedu i marketéři, specialisté na [SEO](https://www.mergado.cz/tema/seo) nebo PPC reklamu.

Jaké jsou rozdíly aplikace oproti jiným nástrojům? Programy jako *Screaming Frog* nebo *Xenu* fungují na jednorázovém principu a spuští se na lokálním zařízení. Scraping Camel pracuje přesně naopak – **běží na serveru nonstop**. Výstupy poskytuje ve strojově čitatelné podobě, které dokážete dále i strojově zpracovávat. Využijete ho tak k jednorázovým analýzam, kde data automaticky zpracuje další software.

### Shrnutí

**Výhody aplikace Scraping Camel:**

- neustálý monitoring změn
- funguje na serveru (non-stop)
- možnost nahrát do Mergada jako vstupní soubor pro export a s tímto dále pracovat obvyklým způsobem
- neomezený počet webů na jeden účet

**Co byste měli vědět:**

- appka nevykresluje JavaScript, funguje pouze na základě HTML
- princip extrakce dat je na základě znaků, ne na základě elementů
- podmínkou pro používání Scraping Camelu je funkční soubor sitemap a ověřená doména

Vyzkoušejte si funkce Scraping Camel naplno **na 30 dní zdarma** a zúročte výhody kvalitně získaných dat.



 

- [  Scraping Camel ](https://www.mergado.cz/tema/scraping-camel)
 
 [    ![](https://www.mergado.cz/sites/default/files/perm/image/profil-foto.jpg)  ](https://www.mergado.cz/blog/petra-markova)###  [ Petra Marková ](https://www.mergado.cz/blog/petra-markova) 

Slovenský trh a libozvučnou slovenštinu má v Mergadu na starosti content specialistka Petra. Textuje, bloguje, překládá a s vášní tvoří obsah na sociální sítě. A když zrovna nehledá ta správná slova, věnuje svůj čas své bytové džungli, pečení, kavárnám nebo cestování.

 

 

 

 

 

 

 

 

 

## Mohlo by vás *zajímat*

 

 [    ![](https://www.mergado.cz/sites/default/files/perm/image/gpsr-allegro-kaufland.png)  

### Jak na GPSR na Allegru a Kauflandu: S tímto průvodcem sami doplníte e‑shop o požadované údaje

 

 ](https://www.mergado.cz/blog/gpsr-allegro-kaufland) 

 [    ![Alternativní produkty náhled blog](https://www.mergado.cz/sites/default/files/perm/image/mergado-nahledovky_na_blog-landscape-1200_x_628_px_3.png)  

### Zobrazujte nejvhodnější alternativní produkty. Nakoupí u vás více zákazníků

 

 ](https://www.mergado.cz/blog/alternativni-produkty) 

 [    ![ice cat produktový katalóg](https://www.mergado.cz/sites/default/files/perm/image/ice_cat_katalog_clanek_cz.png)  

### Katalog Icecat vám pomůže doplnit chybějící produktová data. S Mergadem ho propojíte aplikací Clicking Goat

 

 ](https://www.mergado.cz/blog/icecat-clicking-goat-doplnte-chybejici-data) 

 

 

 

## Ať vám *nic neunikne*

 Přihlašte se do našeho newsletteru 

   

       

   Přihlášením souhlasíte, že vaše údaje zpracujeme v souladu s podmínkami o [ochraně osobních údajů](https://www.mergado.cz/prohlaseni-o-cookies). 

  Děkujeme, úspěšně jste se připojili k našemu seznamu odběratelů. 

 

 

 
      function ml_webform_success_5807248() {
        var r = ml_jQuery || jQuery
        r('.ml-subscribe-form-5807248 .row-success').show(), r('.ml-subscribe-form-5807248 .row-form').hide()
      }