Dada una string str que contiene algunas etiquetas HTML , la tarea es eliminar todas las etiquetas presentes en la string str dada .
Ejemplos:
Entrada: str = “<div><b>Geeks for Geeks</b></div>”
Salida: Geeks for Geeks
Entrada: str = “<a href=”https://www.geeksforgeeks.org/”> GFG</a>”
Salida: GFG
Enfoque: La idea es usar la expresión regular para resolver este problema. Se pueden seguir los siguientes pasos para calcular la string resultante:
- Consigue la cuerda.
- Dado que todas las etiquetas HTML están encerradas entre corchetes angulares ( <> ). Por lo tanto, use la función replaceAll() en expresiones regulares para reemplazar cada substring que comience con «<« y termine con «>» para vaciar la string.
- La función se utiliza como:
String str; str.replaceAll("\\", "");
A continuación se muestra la implementación del enfoque anterior:
C++
// C++ program for the above approach #include <iostream> #include <regex> using namespace std; // Function to remove the HTML tags // from the given string void RemoveHTMLTags(string s) { const regex pattern("\\<.*?\\>"); // Use regex_replace function in regex // to erase every tags enclosed in <> s = regex_replace(s, pattern, ""); // Print string after removing tags cout << s; return ; } // Driver Code int main() { // Given String string str = "<div><b>Geeks for Geeks</b></div>"; // Function call to print the // HTML string after removing tags RemoveHTMLTags(str) ; return 0; } // This code is contributed by yuvraj_chandra
Java
// Java program for the above approach class GFG { // Function to remove the HTML tags // from the given tags static void RemoveHTMLTags(String str) { // Use replaceAll function in regex // to erase every tags enclosed in <> str = str.replaceAll("\\<.*?\\>", ""); // Print string after removing tags System.out.println(str); } // Driver Code public static void main(String[] args) { String str; // Given String str = "<div><b>Geeks for Geeks</b></div>"; // Function call to print the // HTML string after removing tags RemoveHTMLTags(str); } }
Python3
# Python3 program for the # above approach import re # Function to remove the HTML tags # from the given tags def RemoveHTMLTags(strr): # Print string after removing tags print(re.compile(r'<[^>]+>').sub('', strr)) # Driver code if __name__=='__main__': # Given String strr = "<div><b>Geeks for Geeks</b></div>" # Function call to print the HTML # string after removing tags RemoveHTMLTags(strr); # This code is contributed by vikas_g
C#
// C# program for the above approach using System; class GFG{ // Function to remove the HTML tags // from the given tags static void RemoveHTMLTags(String str) { // Use replaceAll function in regex // to erase every tags enclosed in <> // str = Regex.Replace(str, "<.*?>", String.Empty) System.Text.RegularExpressions.Regex rx = new System.Text.RegularExpressions.Regex("<[^>]*>"); str = rx.Replace(str, ""); // Print string after removing tags Console.WriteLine(str); } // Driver code public static void Main(String []args) { String str; // Given String str = "<div><b>Geeks for Geeks</b></div>"; // Function call to print the // HTML string after removing tags RemoveHTMLTags(str); } } // This code is contributed by vikas_g
Javascript
<script> // JavaScript program for the above approach // Function to remove the HTML tags // from the given string function RemoveHTMLTags(s) { const pattern = new RegExp("\\<.*?\\>"); // Use regex_replace function in regex // to erase every tags enclosed in <> s = new String(s).replace(pattern, ""); // Print string after removing tags document.write(s); return; } // Driver Code // Given String let str = "<div><b>Geeks for Geeks</b></div>"; // Function call to print the // HTML string after removing tags RemoveHTMLTags(str); </script>
Producción:
Geeks for Geeks