Back to Question Center
0

नमस्कार सांगते की एचटीएमएल वेबसाईट्स कडून आवश्यक डेटा कसे काढायचे

1 answers:

नेटमध्ये सादर केलेली मोठी माहिती "असंरक्षित" मानली जाते कारण ते योग्यरित्या आयोजित केलेले नाही. एचटीएमएल वेबसाइट्स ज्या प्रकारे त्यात संघटित कागदपत्रे आहेत त्या वेगळ्या आहेत आणि कागदपत्रांमध्ये सादर केलेला मजकूर मूळ HTML कोडमध्ये संरचित आहे.

एचटीएमएल वेबसाईट्सच्या तीन मुख्य डाटा वेचा पध्दती आहेत:

  • आपल्या कॉम्प्यूटरवर वेब पृष्ठावरील मजकूर जतन करणे;
  • डेटा काढण्यासाठी कोड लिहिणे;
  • विशेष काढण्याचे साधन वापरणे;

1. कोडिंगशिवाय वेबसाइटवरून एचटीएमएल कसे काढायचे

आपण खाली दिलेल्या चरणांचा वापर करून वेब पृष्ठ सामग्री निरुपयोगी

(2 9)

काढू शकता - new smart home gadgets. फक्त मजकूर

आपल्याला हवा असलेला मजकूर असलेला वेबपृष्ठ उघडल्यानंतर, राइट-क्लिक करा आणि "पृष्ठ म्हणून जतन करा" किंवा "सेव्ह ऍज" पर्याय निवडा. "फाइल नाव" फील्डमध्ये आणि "Save as Type" ड्रॉप-डाउन मेनुमधून फाईलसाठी नाव टाइप करा, "वेब पृष्ठ, फक्त HTML निवडा. "जतन करा" बटणावर क्लिक करा आणि काही सेकंद प्रतीक्षा करा.

त्या पृष्ठावरील सर्व मजकूर काढला जातो आणि एक HTML फाईल म्हणून जतन केला जातो. मूळ पृष्ठ-स्वरूपण पर्याय अखंड राहतात आणि आपण अशा मजकूर संपादकात सामग्री संपादित करू शकता जसे नोटपॅड.

संपूर्ण वेबपृष्ठ काढणे

"फाइल" मेनूमध्ये "या रुपात जतन करा" किंवा "पृष्ठ म्हणून जतन करा" पर्याय निवडा. नंतर, "Save As Type" ड्रॉप-डाउन मेनूमधून "वेब पृष्ठ, पूर्ण" वर क्लिक करा. "जतन करा" वर क्लिक केल्यानंतर, मजकूर आणि प्रतिमा पृष्ठावरुन काढले जातील आणि आपण कुठेही जतन केले जाईल. प्रतिमा एका फोल्डरमध्ये संग्रहित केल्या जात असताना मजकूर HTML फाइलमध्ये ठेवला आहे.

2. कोडींग वापरून वेबसाइटवरून एचटीएमएल एक्सट्रॅक्ट करणे

आपण विशेष साधने वापरून HTML फाइल्स थेट काम करू शकता. तसेच, आपण सर्व HTML टॅग्ज काढण्यासाठी आणि XPath किंवा रेग्युलर एक्स्प्रेशन वापरून HTML फायलींमध्ये असलेला मजकूर कायम ठेवू शकता. या कार्यासाठी काही लोकप्रिय प्रोग्रामिंग भाषांपैकी Python, Java, JS, Go, PHP आणि NodeJs यांचा समावेश आहे.

3. वेब डेटा निष्कर्षण साधनांचा वापर करणे

जर आपण संकेतस्थळावरून एचटीएमएल फाइल्स एका ओळीचा कोड लिहित न काढू इच्छित असाल किंवा कॉपी आणि पेस्ट पद्धतीचा अत्याचार टाळता, वेब स्क्रॅपिंग साधने वापरा. खरं तर, काही उपयुक्त साधने उपलब्ध आहेत जी वेबसाइटवरून आवश्यक माहिती कापू शकतात आणि नंतर संरचित स्वरूपात रूपांतरीत करतात. फक्त काही स्क्रॅपिंग टूल s वापरून पहा आणि आपल्या स्क्रॅपिंग गरजा पूर्ण करण्यासाठी आपण निश्चितपणे ते शोधू शकाल.

December 22, 2017