Programa para eliminar etiquetas HTML de una string dada

Dada una string str que contiene algunas etiquetas HTML , la tarea es eliminar todas las etiquetas presentes en la string str dada .

Entrada: str = “<div><b>Geeks for Geeks</b></div>” 
Salida: Geeks for Geeks
Entrada: str = “<a href=””> GFG</a>” 
Salida: GFG 

Enfoque: La idea es usar la expresión regular para resolver este problema. Se pueden seguir los siguientes pasos para calcular la string resultante: 

  1. Consigue la cuerda.
  2. Dado que todas las etiquetas HTML están encerradas entre corchetes angulares ( <> ). Por lo tanto, use la función replaceAll() en expresiones regulares para reemplazar cada substring que comience con «<« y termine con «>» para vaciar la string.
  3. La función se utiliza como: 
String str;
str.replaceAll("\\", "");

A continuación se muestra la implementación del enfoque anterior:


// C++ program for the above approach
#include <iostream>
#include <regex>
using namespace std;
// Function to remove the HTML tags
// from the given string
void RemoveHTMLTags(string s)
  const regex pattern("\\<.*?\\>");
  // Use regex_replace function in regex
  // to erase every tags enclosed in <>
  s = regex_replace(s, pattern, "");
  // Print string after removing tags
  cout << s;
  return ;
// Driver Code
int main()
  // Given String
  string str = "<div><b>Geeks for Geeks</b></div>";
  // Function call to print the
  // HTML string after removing tags
  RemoveHTMLTags(str) ;
  return 0;
// This code is contributed by yuvraj_chandra


// Java program for the above approach
class GFG {
    // Function to remove the HTML tags
    // from the given tags
    static void RemoveHTMLTags(String str)
        // Use replaceAll function in regex
        // to erase every tags enclosed in <>
        str = str.replaceAll("\\<.*?\\>", "");
        // Print string after removing tags
    // Driver Code
    public static void main(String[] args)
        String str;
        // Given String
        str = "<div><b>Geeks for Geeks</b></div>";
        // Function call to print the
        // HTML string after removing tags


# Python3 program for the
# above approach
import re
# Function to remove the HTML tags
# from the given tags
def RemoveHTMLTags(strr):
    # Print string after removing tags
    print(re.compile(r'<[^>]+>').sub('', strr))
# Driver code
if __name__=='__main__':
    # Given String
    strr = "<div><b>Geeks for Geeks</b></div>"
    # Function call to print the HTML
    # string after removing tags
# This code is contributed by vikas_g


// C# program for the above approach
using System;
class GFG{
// Function to remove the HTML tags
// from the given tags
static void RemoveHTMLTags(String str)
    // Use replaceAll function in regex
    // to erase every tags enclosed in <>
    // str = Regex.Replace(str, "<.*?>", String.Empty)
    System.Text.RegularExpressions.Regex rx =
    new System.Text.RegularExpressions.Regex("<[^>]*>");
    str = rx.Replace(str, "");
    // Print string after removing tags
// Driver code
public static void Main(String []args)
    String str;
    // Given String
    str = "<div><b>Geeks for Geeks</b></div>";
    // Function call to print the
    // HTML string after removing tags
// This code is contributed by vikas_g


// JavaScript program for the above approach
// Function to remove the HTML tags
// from the given string
function RemoveHTMLTags(s) {
    const pattern = new RegExp("\\<.*?\\>");
    // Use regex_replace function in regex
    // to erase every tags enclosed in <>
    s = new String(s).replace(pattern, "");
    // Print string after removing tags
// Driver Code
// Given String
let str = "<div><b>Geeks for Geeks</b></div>";
// Function call to print the
// HTML string after removing tags

Geeks for Geeks


Publicación traducida automáticamente

Artículo escrito por spp____ y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *