Back to Question Center
0

नमस्कार सांगते की एचटीएमएल वेबसाईट्स कडून आवश्यक डेटा कसे काढायचे

1 answers:

नेटमध्ये सादर केलेली मोठी माहिती "असंरक्षित" मानली जाते कारण ते योग्यरित्या आयोजित केलेले नाही. एचटीएमएल वेबसाइट्स ज्या प्रकारे त्यात संघटित कागदपत्रे आहेत त्या वेगळ्या आहेत आणि कागदपत्रांमध्ये सादर केलेला मजकूर मूळ HTML कोडमध्ये संरचित आहे.

एचटीएमएल वेबसाईट्सच्या तीन मुख्य डाटा वेचा पध्दती आहेत:

  • आपल्या कॉम्प्यूटरवर वेब पृष्ठावरील मजकूर जतन करणे;
  • डेटा काढण्यासाठी कोड लिहिणे;
  • विशेष काढण्याचे साधन वापरणे;

1. कोडिंगशिवाय वेबसाइटवरून एचटीएमएल कसे काढायचे

आपण खाली दिलेल्या चरणांचा वापर करून वेब पृष्ठ सामग्री निरुपयोगी

(2 9)

काढू शकता. फक्त मजकूर

आपल्याला हवा असलेला मजकूर असलेला वेबपृष्ठ उघडल्यानंतर, राइट-क्लिक करा आणि "पृष्ठ म्हणून जतन करा" किंवा "सेव्ह ऍज" पर्याय निवडा. "फाइल नाव" फील्डमध्ये आणि "Save as Type" ड्रॉप-डाउन मेनुमधून फाईलसाठी नाव टाइप करा, "वेब पृष्ठ, फक्त HTML निवडा - real driving licence to buy. "जतन करा" बटणावर क्लिक करा आणि काही सेकंद प्रतीक्षा करा.

त्या पृष्ठावरील सर्व मजकूर काढला जातो आणि एक HTML फाईल म्हणून जतन केला जातो. मूळ पृष्ठ-स्वरूपण पर्याय अखंड राहतात आणि आपण अशा मजकूर संपादकात सामग्री संपादित करू शकता जसे नोटपॅड.

संपूर्ण वेबपृष्ठ काढणे

"फाइल" मेनूमध्ये "या रुपात जतन करा" किंवा "पृष्ठ म्हणून जतन करा" पर्याय निवडा. नंतर, "Save As Type" ड्रॉप-डाउन मेनूमधून "वेब पृष्ठ, पूर्ण" वर क्लिक करा. "जतन करा" वर क्लिक केल्यानंतर, मजकूर आणि प्रतिमा पृष्ठावरुन काढले जातील आणि आपण कुठेही जतन केले जाईल. प्रतिमा एका फोल्डरमध्ये संग्रहित केल्या जात असताना मजकूर HTML फाइलमध्ये ठेवला आहे.

2. कोडींग वापरून वेबसाइटवरून एचटीएमएल एक्सट्रॅक्ट करणे

आपण विशेष साधने वापरून HTML फाइल्स थेट काम करू शकता. तसेच, आपण सर्व HTML टॅग्ज काढण्यासाठी आणि XPath किंवा रेग्युलर एक्स्प्रेशन वापरून HTML फायलींमध्ये असलेला मजकूर कायम ठेवू शकता. या कार्यासाठी काही लोकप्रिय प्रोग्रामिंग भाषांपैकी Python, Java, JS, Go, PHP आणि NodeJs यांचा समावेश आहे.

3. वेब डेटा निष्कर्षण साधनांचा वापर करणे

जर आपण संकेतस्थळावरून एचटीएमएल फाइल्स एका ओळीचा कोड लिहित न काढू इच्छित असाल किंवा कॉपी आणि पेस्ट पद्धतीचा अत्याचार टाळता, वेब स्क्रॅपिंग साधने वापरा. खरं तर, काही उपयुक्त साधने उपलब्ध आहेत जी वेबसाइटवरून आवश्यक माहिती कापू शकतात आणि नंतर संरचित स्वरूपात रूपांतरीत करतात. फक्त काही स्क्रॅपिंग टूल s वापरून पहा आणि आपल्या स्क्रॅपिंग गरजा पूर्ण करण्यासाठी आपण निश्चितपणे ते शोधू शकाल.

December 22, 2017