Programa para eliminar etiquetas HTML de una string dada

Dada una string str que contiene algunas etiquetas HTML , la tarea es eliminar todas las etiquetas presentes en la string str dada .
Ejemplos: 
 

Entrada: str = “<div><b>Geeks for Geeks</b></div>” 
Salida: Geeks for Geeks
Entrada: str = “<a href=”https://www.geeksforgeeks.org/”> GFG</a>” 
Salida: GFG 
 

Enfoque: La idea es usar la expresión regular para resolver este problema. Se pueden seguir los siguientes pasos para calcular la string resultante: 
 

  1. Consigue la cuerda.
  2. Dado que todas las etiquetas HTML están encerradas entre corchetes angulares ( <> ). Por lo tanto, use la función replaceAll() en expresiones regulares para reemplazar cada substring que comience con «<« y termine con «>» para vaciar la string.
  3. La función se utiliza como: 
     
String str;
str.replaceAll("\\", "");

A continuación se muestra la implementación del enfoque anterior:
 

C++

// C++ program for the above approach
#include <iostream>
#include <regex>
using namespace std;
 
// Function to remove the HTML tags
// from the given string
void RemoveHTMLTags(string s)
{
  const regex pattern("\\<.*?\\>");
 
  // Use regex_replace function in regex
  // to erase every tags enclosed in <>
  s = regex_replace(s, pattern, "");
 
  // Print string after removing tags
  cout << s;
 
  return ;
}
 
// Driver Code
int main()
{
   
  // Given String
  string str = "<div><b>Geeks for Geeks</b></div>";
 
  // Function call to print the
  // HTML string after removing tags
  RemoveHTMLTags(str) ;
 
  return 0;
}
 
// This code is contributed by yuvraj_chandra

Java

// Java program for the above approach
 
class GFG {
 
    // Function to remove the HTML tags
    // from the given tags
    static void RemoveHTMLTags(String str)
    {
 
        // Use replaceAll function in regex
        // to erase every tags enclosed in <>
        str = str.replaceAll("\\<.*?\\>", "");
 
        // Print string after removing tags
        System.out.println(str);
    }
 
    // Driver Code
    public static void main(String[] args)
    {
        String str;
 
        // Given String
        str = "<div><b>Geeks for Geeks</b></div>";
 
        // Function call to print the
        // HTML string after removing tags
        RemoveHTMLTags(str);
    }
}

Python3

# Python3 program for the
# above approach
import re
 
# Function to remove the HTML tags
# from the given tags
def RemoveHTMLTags(strr):
     
    # Print string after removing tags
    print(re.compile(r'<[^>]+>').sub('', strr))
     
# Driver code
if __name__=='__main__':
     
    # Given String
    strr = "<div><b>Geeks for Geeks</b></div>"
     
    # Function call to print the HTML
    # string after removing tags
    RemoveHTMLTags(strr);
     
# This code is contributed by vikas_g

C#

// C# program for the above approach
using System;
 
class GFG{
 
// Function to remove the HTML tags
// from the given tags
static void RemoveHTMLTags(String str)
{
     
    // Use replaceAll function in regex
    // to erase every tags enclosed in <>
    // str = Regex.Replace(str, "<.*?>", String.Empty)
    System.Text.RegularExpressions.Regex rx =
    new System.Text.RegularExpressions.Regex("<[^>]*>");
     
    str = rx.Replace(str, "");
 
    // Print string after removing tags
    Console.WriteLine(str);
}
 
// Driver code
public static void Main(String []args)
{
    String str;
 
    // Given String
    str = "<div><b>Geeks for Geeks</b></div>";
 
    // Function call to print the
    // HTML string after removing tags
    RemoveHTMLTags(str);
}
}
 
// This code is contributed by vikas_g

Javascript

<script>
 
// JavaScript program for the above approach
 
 
// Function to remove the HTML tags
// from the given string
function RemoveHTMLTags(s) {
    const pattern = new RegExp("\\<.*?\\>");
 
    // Use regex_replace function in regex
    // to erase every tags enclosed in <>
    s = new String(s).replace(pattern, "");
 
    // Print string after removing tags
    document.write(s);
 
    return;
}
 
// Driver Code
 
 
// Given String
let str = "<div><b>Geeks for Geeks</b></div>";
 
// Function call to print the
// HTML string after removing tags
RemoveHTMLTags(str);
 
</script>
Producción: 

Geeks for Geeks

 

Publicación traducida automáticamente

Artículo escrito por spp____ y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *